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Presentación 


Las profundas transformaciones experimentadas en ei 
entorno desde finaies de ios sesenta han introducido 
dificuitades adicionaies en ios procesos decisionaies de ias 
empresas. De unos marcos de referencia moderadamente 
estabies, en ios que ias unidades económicas apiicaban 
métodos y modeios de gestión extrapoiativos, se ha pasado 
a encontrar unas estructuras de encuadramiento 
institucionaies, sociaies, económicas, tecnoiógicas y 
sociocuituraies en constante transformación. 

Ante este nuevo panorama, ias empresas necesitan conocer 
métodos de obtención de información y técnicas para 
tratada. La investigación comercia i ha ido escaiando 
puestos en ias empresas con ei transcurso dei tiempo y 
ensanchando su campo de apiicaciones. En un principio se 
centró en ia medida de ia eficacia de actividades de 
comunicación, esenciaimente pubiicidad, o de aigunos 
instrumentos promocionaies, como cupones o vaies de 
descuento. Ya en este sigio, ia Universidad y ia Empresa ia 
integran formaimente en sus áreas de actividad. Se crean 
departamentos e institutos de investigación comerciai. Se 
estudian actitudes, creencias, comportamientos y 
motivaciones que permiten a ias empresas mejorar 
constantemente ei diseño de su mix de marketing. 

Pero ia compiejidad y variabiiidad dei entorno han eievado a 
i a Investigación Comerciai a i a categoría de ciencia 
fundamenta! para ia planificación de ia empresa, por 
encima de vinculaciones a departamentos específicos o 
áreas funcionales. En ia actualidad no se concibe la 
actividad de las empresas sin investigación comercia! en 
mayor o menor grado. Los manuales que tratan esta ciencia 



suelen resultar o demasiado técnicos, centrados en 
desarrollos muy cuantitativos, o demasiado genéricos, casi 
al borde de lo divulgativo. Este ha sido uno de los motivos 
que nos han Impulsado a escribir esta obra. Nuestro deseo 
ha sido preparar un trabajo riguroso, aunque sencillo en su 
exposición, que abarque todos los aspectos que pueden 
tener Interés en aprender a hacer Investigación comercial, 
tanto para los estudiantes y estudiosos que se Introducen 
por primera vez en esta materia, como para el profesional 
de la gestión de la empresa, deseoso de Integrarla en sus 
procesos decislonales. 

Este manual se complementa con otra publicación de ESlC 
Editorial, titulada «Aplicaciones de la investigación 
comercial para el mix de marketing», también de los 
mismos autores, que plantea y resuelve casos prácticos 
aplicando los fundamentos y las técnicas expuestas en este 
libro. 

Aranguren, 2011 

Ildefonso Grande y Elena Abascal 
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CONCEPTO Y 
PLANIFICACIÓN DE LA 
INVESTIGACIÓN 
COMERCIAL 

1.1. INTRODUCCIÓN. OBJETIVOS 
DEL CAPÍTULO 

En este capítulo se exponen diversos conceptos de 

investigación comercial y se resaltan sus características 

básicas. Una vez concluida su lectura el lector conocerá, 

• Qué es un sistema de información de marketing. 

• El concepto, características y clasificación de 
investigaciones comerciales. 

• El proceso de planificación y control de las 
investigaciones comerciales. 

• Cómo se organiza un departamento de investigación 
comercial en una empresa. 

• Cuáles son los frenos a la implantación de la 
investigación comercial. 

• Criterios a considerar para contratar estudios de 
mercado. 

• Qué deben exigir las empresas a los institutos que 
desarrollan estudios de mercado antes de contratar sus 







servicios. 


1.2. EL SISTEMA DE 
INVESTIGACIÓN DE 
MARKETING 

Las empresas toman decisiones sobre qué productos 
desarrollan y qué mercados atienden. Diseñan bienes y 
servicios, fijan precios, distribuyen sus productos y se 
comunican con el mercado. Para poder tomar estas 
decisiones necesitan información. También analizan los 
resultados de sus acciones y los valoran, desarrollan 
controles y para ello deben encontrar información. Ésta 
puede ya existir en el momento de plantearse su necesidad, 
y su procedencia puede ser externa a la empresa o haber 
sido generada por ella misma. Es posible que la información 
que se haga necesaria obtener tenga que proceder de una 
investigación desarrollada ex profeso. 

Las organizaciones necesitan crear lo que se denomina un 
sistema de investigación de marketing, que puede ser 
definido como un conjunto de personas, procedimientos e 
instrumentos para recoger, vaiorar, tratar y difundir 
información con objeto de conocer ei entorno, tomar 
decisiones o evaiuar resuitados. 

Este sistema lo alimentan, a su vez, otros dos subsistemas: 

• El sistema de inteligencia de marketing se crea para 
analizar el entorno general de las empresas, o 
macroentorno, y recoge información relativa a los 
entornos demográfico, económico, político, legal, 
sociocultural y tecnológico. Para alimentar este sistema 





se podrían recoger e incluir informaciones relacionadas 
con las pirámides de edades de los mercados, la 
legislación en materia de productos, las prácticas 
mercantiles, la situación de la coyuntura económica, el 
poder de compra, los valores, comportamientos, 
creencias y gustos de los consumidores o la evolución 
de las tecnologías. La información procede del análisis 
de fuentes externas a las organizaciones, como 
bibliografía, bases de datos, legislación, estadísticas, 
internet o noticias de diversa índole que pudieran tener 
interés para la actividad de las organizaciones. 

La denominación de flujo de inteligencia proviene del 
campo militar. Los militares de mayor rango no se 
encuentran en el campo de batalla. Dirigen las operaciones 
a medida que les llega información sobre cómo se 
desarrollan los hechos, pero no se encuentran físicamente 
en él. Los cuadros superiores de las empresas también las 
dirigen sin estar en el mercado. No ven a los clientes, ni a los 
proveedores, ni conocen a los distribuidores. Gestionan las 
empresas a partir de la información que les llega. Toman 
decisiones y las transmiten para que se ejecuten. 

• El sistema de información interna de marketing lo 
componen las informaciones relativas a los resultados y 
experiencias de las empresas. Recoge, en definitiva, los 
flujos de información de las organizaciones con su 
microentorno. 

Existe información dentro de las organizaciones que 
proporcionan sus áreas funcionales, como estadísticas de 
ventas, comportamiento de los mercados, informes de 
vendedores, estados contables y financieros, características 
de los productos, sistemas de producción, etc. Pero, además, 
el elemento humano de la empresa puede añadir 
información complementaria e interesante; por ejemplo, los 



vendedores o los responsables de connpras pueden aportar 
información, basada en su experiencia y trato con clientes o 
proveedores. 

El gráfico 1.1 muestra los flujos del sistema de marketing 
y ofrece de forma esquemática sus interrelaciones. 

Klimage 

Gráfico 1.1. El sistema de información de marketing 

1.3. LA INVESTIGACIÓN 

COMERCIAL. CONCEPTO Y 
CARACTERÍSTICAS 


La investigación comercial se puede definir como un 
proceso de identificación, vaioración, seiección y 
tratamiento de información para comprender ei entorno, 
tomar decisiones o evaiuar resuitados. Es un proceso, 

• Sistemático. Aplica una metodología rigurosa; 
planificado, organizado, con unos objetivos muy claros 
y muy bien definidos. Esta sistemática se resume en 
que deben analizarse con detenimiento las situaciones, 
para identificar las causas de los problemas, deben 
definirse con precisión los objetivos de las 
investigaciones, recoger la información, valorar su 
idoneidad, analizarla, obtener conclusiones y proponer 
acciones. 

• Objetivo. La investigación comercial ha de ser neutral 
y deben evitarse los sesgos personales y los prejuicios. 
El método que deba aplicarse será científico, de forma 


que cualquier investigador que lo aplique llegue a los 
mismos resultados. La objetividad implica imparcialidad 
y unicidad de resultados y conclusiones. 

Informativo. La investigación comercial es un 
componente esencial en el diseño de los sistemas de 
información en las organizaciones y es básica para 
desarrollar con éxito tareas de planificación y de toma 
de decisiones, o evaluar los resultados de las ya 
tomadas. 

Orientado a la toma de decisiones. Las 

investigaciones comerciales no se desarrollan por 
simple curiosidad. Cuestan grandes esfuerzos y dinero. 
Muchas veces comprometen el futuro de las 
organizaciones. Deben proporcionar información útil 
para comprender situaciones o problemas, tomar 
decisiones y medir las consecuencias de las ya 
tomadas. 

Básico o aplicado. Las investigaciones pueden 
pretender aproximarse a problemas o comprender 
situaciones, o ir más allá, y constituir un elemento 
básico para la toma de decisiones inmediatas o el 
control o seguimiento de las ya tomadas. En el primer 
caso se trata de investigaciones básicas, y en segundo, 
de investigaciones aplicadas. 


1.4. ENFOQUES 

EMPRESARIALES, ENTORNO 
E INVESTIGACIÓN 
COMERCIAL 



La investigación comercial no ha surgido por generación 
espontánea. Ha sido el resultado de un largo proceso de 
acumulación de conceptos y herramientas cualitativas y 
cuantitativas, que se han ido acuñando y vertebrando a 
medida que se han necesitado para resolver problemas, 
analizar la realidad o tomar decisiones. Las aportaciones de 
los economistas, sicólogos, sociólogos, estadísticos, 
matemáticos y empresarios se han fundido en el crisol de la 
necesidad de conocer. Sus esfuerzos han ido configurando la 
investigación comercial. 

El concepto de investigación comercial, su evolución y sus 
aplicaciones han discurrido de forma paralela a los objetivos 
de marketing de las empresas, es decir, lo que se pretende 
con los intercambios; qué problemas de gestión surgen en el 
tiempo y las soluciones que se proponen para ello, y qué 
aportaciones teóricas enriquecen esta ciencia. Para 
identificar las etapas por las que ha pasado la investigación 
comerciales se puede prestar atención a los siguientes 
criterios. 

• Económicos; esencialmente las características de los 
mercados en lo que respecta al grado de saturación de 
bienes y a la posibilidad de crecimiento de la oferta de 
las empresas, así como el comportamiento de la 
demanda. 

• Científicos y tecnológicos, que observan los 
inventos logrados, los descubrimientos y las 
características de los bienes producidos en función del 
estado de las tecnologías. También se tienen en cuenta 
los avances de la Estadística, la Econometría o la 
Matemática. 

• Sociales, que consideran las ideologías, la 
urbanización, los estilos de vida y los movimientos o 



conflictos sociales. 


• Empresariales, que se fijan objetivos que las 
organizaciones persiguen con los intercambios y en las 
orientaciones del marketing. 

La investigación comercial ha adquirido el carácter de 
ciencia autónoma, pero hasta conseguirlo ha pasado por una 
serie de etapas, se ha ido configurando en el tiempo. Estas 
etapas son las siguientes. 

• Etapa primitiva. Se caracteriza por el 

desabastecimiento de los mercados, el exceso de 
demanda, tecnologías incipientes y orientaciones 
empresariales a la producción y al beneficio. No existen 
metodologías de obtención y tratamiento de la 

información. Las mayores preocupaciones de las 
empresas se relacionan con la producción; la 
minimización de los costes, la obtención de la 

dimensión óptima; desde un punto de vista comercial 
preocupan la logística y la localización de los puntos de 
venta para llegar al mayor número posible de 
compradores potenciales. Las escasas investigaciones 
que se realizaron en esta época guardan relación con la 
logística comercial. 

• Etapa del primer desarrollo (1860-1920). Se 
caracteriza por cierto grado de abastecimiento de los 
mercados, numerosos descubrimientos e inventos, 
tecnologías más controladas y desarrollo de ciertas 
estrategias de mix de marketing, como envases, 
marcas, promociones de precios y diseño de campañas 
de comunicación. La investigación comercial persigue la 
medición de la eficacia de las estrategias que se 
desarrollan. El objetivo básico de las organizaciones 
sigue siendo la obtención del beneficio. Apenas existen 



técnicas desarrolladas de recogida y análisis de la 
información. Las toscas investigaciones comerciales que 
se desarrollaron en esta época tienen que ver con la 
distribución comercial y con los efectos de actividades 
promocionales, como vales de descuento y otras 
estrategias de precios, efectos de envases, de 
denominaciones de marca y eficacia publicitaria. 

Etapa de formación (1920-1960). Algunos mercados 
comienzan a saturarse, se desarrollan aceleradamente 
las técnicas de recogida y tratamiento de información, 
tanto cualitativas y cuantitativas. Las tecnologías 
productivas están notablemente más desarrolladas. 
Puede decirse que en esta etapa la investigación 
comercial alcanza su mayoría de edad. El objetivo de 
las empresas con los intercambios sigue siendo el 
beneficio. A partir de 1920 la investigación comercial 
no difiere sustancialmente, al menos en su estructura 
básica, de la que se conoce hoy en día. El paso del 
tiempo la enriquece con nuevos y mejores instrumentos 
y técnicas de recogida y análisis de la información. 

Etapa del desarrollo del poder analítico (1960- 
1990). En ella muchos mercados se saturan y emergen 
nuevos competidores. Las tecnologías se desarrollan 
aceleradamente, especialmente la informática y todo lo 
que ella conlleva. Se desarrollan muchas técnicas de 
recogida y análisis de información. El objetivo de los 
intercambios se orienta, además de la consecución del 
beneficio, a la satisfacción del consumidor. El orden 
económico mundial desarrolla de forma acelerada el 
interés por la investigación comercial y contribuye a su 
desarrollo. 

Etapa electrónica (1990 ...). El desarrollo 

tecnológico, informático y de las comunicaciones es 



muy acelerado, y crea nuevas expectativas de progreso 
para la investigación comercial, que se encuentra 
plenamente integrada en los procesos de gestión de las 
organizaciones. El objetivo de los intercambios es el 
beneficio y la contribución al bienestar de la sociedad. 

El cuadro 1.1 muestra, esquemáticamente, la evolución de 
la investigación desde sus orígenes hasta la etapa 
electrónica. 


^--image 

El cuadro 1.2 muestra las condiciones del entorno, los 
principios de organización y gestión, así como la valoración 
de los clientes y de la investigación de mercados en función 
de las orientaciones empresariales. 
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Respecto al futuro de investigación comercial puede 
pensarse que adquirirá progresivamente mayor relevancia, 
hasta convertirse en una actividad imprescindible en las 
empresas considerando la ocurrencia de sucesos 
relacionados con las características de los mercados, y otros 
vinculados con la evolución de las tecnologías de la 
información, que son los siguientes. 

• La tasa esperada de crecimiento de los mercados 

convencionales será muy reducida. El mercado crecerá 
poco, pero en él habrá más empresas participantes, que 
deberán esforzarse en seguir encontrando demandas 
latentes para poder atenderlas, penetrando en 
segmentos y nichos y consolidándose en ellos, como 
ocurre en la actualidad con los fabricantes de 


electrodomésticos convencionales, como lavadoras y 
hornos térmicos o automóviles. 

Se espera que el número de nuevos productos se 
incremente y que los ciclos de vida sean cada vez más 
cortos. La dinámica del mercado originará un proceso 
constante de renovación de los productos. La 
investigación comercial orientada a la detección de 
necesidades, o al diseño de bienes y servicios, resultará 
crucial para que muchas empresas puedan sobrevivir. 

El coste de los fracasos de los productos nuevos 
será mayor que en la actualidad, fundamentalmente 
debido a la pérdida de oportunidades en el mercado, 
difícilmente recuperables dadas las velocidades de los 
cambios y de aparición de otros competidores. Por 
ejemplo, el Mercedes Clase A se desarrolló muy 
rápidamente. Presentó problemas de estabilidad y el 
fabricante tuvo que introducir cambios de diseño que 
costaron mucho dinero. Durante algún tiempo las 
ventas se resintieron de lo ocurrido. 

Las empresas deberán responder con la mayor 
rapidez a los cambios acelerados del entorno, tanto 
general como específico, de la empresa. Los SIM, las 
bases de datos y las investigaciones externas resultarán 
cada vez más necesarias. Los gustos de los 
consumidores, muy cambiantes, la legislación en 
materia de nuevos productos, que impone muchas 
restricciones a los fabricantes, son ejemplos de la 
necesidad de realizar investigaciones para que las 
empresas se encuentren al día respecto a cambios de 
entorno. 

Los mercados tenderán a fragmentarse y las 

empresas se encontrarán con nichos cuya identificación 



y atención es más compleja que con segmentos, 
situaciones que impulsarán aún más la investigación 
comercial. Por ejemplo, el mercado de las calculadoras 
de bolsillo comenzó con productos que realizaban las 
operaciones aritméticas básicas. Posteriormente se les 
añadió memoria y funciones científicas. Hoy en día 
están adaptadas a los deseos de ingenieros, arquitectos 
o navegantes. Incluso hay calculadoras para niños, con 
agenda electrónica o con conexión a un PC. 

• La tecnología informática permite recoger 
información en el punto de venta a través de los 
escáneres y de tarjetas inteligentes, de forma que se 
pueden vincular las compras a las características de los 
compradores y así obtener tipologías de consumidores 
atendiendo a sus características sociodemográficas, 
como edad, género, renta, composición familiar, zona 
de residencia, y otras comportamentales, como la 
fidelidad al establecimiento o la frecuencia de compra. 
Además, Internet facilita el acceso a la información en 
cantidad y calidad insospechada hasta hace muy poco 
tiempo. 

1.5. PLANIFICACIÓN DE LA 

INVESTIGACIÓN COMERCIAL 


Planificar una investigación comercial consiste en definir 
las tareas a realizar, el orden secuencial que debe seguirse 
para su correcto desarrollo y la forma en que deben ser 
ejecutadas. La planificación de la investigación comercial se 
resume en los siguientes pasos. 



Identificar el problema que sugiere la conveniencia 
de desarrollar la investigación y tratar de explicarlo. 
Por ejemplo, la demanda de pilas alcalinas se contrae y 
las ventas caen. Posiblemente los consumidores 
preocupados por la conservación medioambiental las 
rechacen y prefieran las recargables. 

Fijar los objetivos de la investigación. Es decir, 
precisar exactamente qué se investigará. Los 
fabricantes de pilas podrían plantearse dos 
investigaciones, que pueden ser complementarias: 
analizar hasta qué punto existe sensibilidad por el 
medio ambiente y cómo afectará este sentimiento a sus 
ventas en el futuro, o investigar la conveniencia de 
abandonar de inmediato la producción de pilas 
alcalinas en beneficio de las recargables. 

Debe proponerse un diseño de la investigación, es 

decir, debe optarse por una investigación que trate de 
comprender mejor el problema, aproximarse a él, o por 
una investigación que sirva emprender directamente 
acciones, o medir los efectos de las decisiones tomadas. 

Presupuestar la investigación, es decir, valorar 
cuánto dinero va a costar. 

Tomar la decisión de desarrollar la investigación, o 
no, aplicando para ello criterios para la toma de 
decisiones 

Ejecución de la investigación, una vez tomada la 
decisión favorable. Para ello se consigue información, se 
analiza y se llega a resultados y conclusiones. 

Finalmente, se evalúa la investigación y se valoran 
sus aportaciones para solucionar el problema que se ha 



generado, y en general, para conocer cómo se puede 
mejorar la gestión de la empresa u organización. 

En el cuadro 1.3 se resumen las tareas a desarrollar para la 
planificación de la investigación comercial, etapas que serán 
expuestas con mayor profundidad en los siguientes 
apartados. 
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1.5.1. Definición o identificación de la 
situación 

Definir la situación significa identificar o aislar la causa 
que invita a pensar en la posibilidad de desarrollar una 
investigación. La fiebre es un síntoma de una enfermedad, 
no una enfermedad en sí misma. Una reducción de ventas, 
por ejemplo, es también un síntoma de que algo no marcha 
bien. Los empresarios detectan síntomas, pero hay que 
encontrar las causas. El problema puede ser que haya una 
recesión, que el producto no responda a las exigencias de 
los clientes, problemas con la distribución o que haya 
surgido un nuevo competidor agresivo. Un mismo síntoma 
puede tener variadas causas. 

Además, es muy importante no confundir un problema 
de gestión empresarial con un problema de 
investigación de mercados. A continuación se expone una 
situación en la que se desarrolló una investigación de 
mercados para encontrar -erróneamente- una explicación a 
una situación derivada de un fallo en la gestión. Es la 
siguiente. 


Una multinacional anunció hace algunos años una 
máquina de fotos, compacta, que aún no se distribuía. Creó 
interés por un producto que no existía y que los 
consumidores acabaron compraron a otros fabricantes. La 
investigación que se llevó a cabo para conocer las causas de 
la escasa aceptación de la máquina de fotos fue superflua. 
Se había cometido un error en el proceso secuencial de 
lanzamiento de un producto nuevo: el plan de comunicación 
no debió empezar hasta haber asegurado la distribución de 
la máquina de fotos. Aquí se produjo un fallo de gestión. No 
había un problema que pidiera una investigación de 
mercados. 

Para que una empresa identifique un problema de 
investigación de mercados deben hacerse seguimientos o 
valoraciones de la situación que está invitando a desarrollar 
la investigación. Para ello, los responsables comenzarán por 
analizar su propia empresa, a los consumidores y el entorno, 
mediante juicios de expertos, formulando hipótesis, 
utilizando modelos, intuiciones o experiencias. En el cuadro 
1.4 se muestran objetos de análisis o áreas a estudiar, y 
aspectos concretos a analizar. 


Cuadro 1.4. Objetos de análisis para identificar 
problemas de investigación de mercados 


Objetos o 
áreas de 
análisis 

Aspectos, asuntos o variables a 
analizar 

Antecedentes 
de la empresa: 
productos y 
mercados 
donde actúa 

• Ventas globales, por productos, por 
mercados, por clientes importantes 

• Cuota de mercado, por productos, por 
mercados, por clientes 

• Rentabilidad general, por productos, por 
líneas. Tendencias observadas 







Circunstancias, 
objetivos y 
recursos de los 
decisores 


Análisis de los 
consumidores 


Entorno 

general 


Productos: líneas, gama, composición y 
antigüedad de la cartera de productos, 
innovaciones recientes 
Márgenes por productos, mercado, por 
clientes 

Mercados; localización, importancia, 
nivel de saturación, tendencias 
observadas en su evolución 
Canales de distribución; clases, 
importancia 

Cartera de pedidos; evolución, 
expectativas 

Recursos económicos, situación 
financiera, cualificación del equipo 
humano de la organización, misión y 
objetivos de la empresa 

Localización geográfica 
Perfil demográfico o sociodemográfico: 
edad, género, lugar de residencia, nivel 
de estudios, renta 

Respuesta observada a promociones 
Sensibilidad ante el precio 
Tipo de establecimiento que prefieren. 
Valores, creencias, actitudes, hábitos 
Estilos de vida 

Legal: legislación sobre productos, 
fiscalidad y prácticas comerciales, medio 
ambiente, movimientos de consumidores 
Económico: renta, inflación, paro, tipos 
de interés, expectativas de crecimiento, 
clima laboral 

Demográfico; composición de la 
población por edad y género 














situación se puede acudir teorías o a formular hipótesis que 
posteriormente deberán ser contrastadas. 


• Teorías. Algunos fenómenos económicos son 
explicados por teorías. La Microeconomía defiende que 
-bajo ciertas circunstancias- una reducción del precio 
incrementa el consumo. Una elevación lo contrae. 

• Hipótesis. Otras veces no existen teorías que 
expliquen los fenómenos. Entonces se puede acudir a 
formular hipótesis, basadas en el sentido común, en la 
experiencia o en la intuición, y contrastarlas con 
instrumentos estadísticos cuando se pueda. Una 
hipótesis que se puede formular para explicar la caída 
de las ventas de pilas alcalinas es que los 
consumidores, preocupados por el medio ambiente, no 
deseen pilas desechadles y prefieran las recargables. 

Para analizar el problema el equipo humano puede actuar 
de tres formas, aislada o conjuntamente. 

• Mediante discusiones o conversaciones entre las 
personas que tomen decisiones o que puedan aportar 
ideas. Lo que se pretende con ellas es desarrollar una 
puesta en común de conocimientos, valoraciones, 
puntos de vista e inquietudes sobre las causas posibles 
del problema o situación que afecta a la empresa. 

• Buscando y analizando información secundaria, que 
son datos existentes previos a la aparición del 
problema, como series estadísticas, estudios 
sociológicos de comportamiento del consumidor, bases 
de datos con información relevante para las empresas, 
informes económicos y de coyuntura, etc. 



• Desarrollando investigaciones cualitativas. A veces, 

las empresas no tienen más remedio que acudir a 
entrevistar a personas, reunirse con ellas y discutir 
situaciones u observar sus comportamientos, porque no 
existen otras fuentes de información. Son precisamente 
estas informaciones las que permiten a las 
organizaciones llegar a familiarizarse con los 

problemas, o por lo menos, llegar a comprenderlos. 

• Analizando casos de situaciones similares si es que 
las hubo, de la empresa o de otras organizaciones, para 
conocer cómo se actuó para identificar el problema. 


1.5.3. Definición de los objetivos de la 
investigación 

La fijación de objetivos consiste en precisar exactamente 
cuál será el objeto de la investigación; qué se estudiará y 
por qué. La definición de objetivos de una investigación 
comercial es un trabajo de equipo Además de los cuadros 
superiores, intermedios e investigadores, debe participar 
todo aquel que pueda aportar ideas. A continuación se 
muestra el cuadro 1.5, en el que figuran los integrantes de 
un equipo de investigación y se señalan cuáles son sus 
funciones. 


Cuadro 1.5. Formación de un equipo investigador y 

sus funciones 


Componentes de un 
equipo investigador 

Funciones que desarrollan 

Los cuadros 
superiores o 

directores porque son 

• Identificar los problemas 

• Proponer objetivos de 
investigación 







responsables de áreas 
funcionales: 
producción, marketing, 
finanzas y recursos 
humanos. 

• Hacer un seguimiento 
continuado de su desarrollo 

• Auditar la investigación una vez 
finalizada 

Los cuadros 
intermedios, porque 

• Rápidamente 
identifican los 
síntomas de los 
problemas. 

• Se comunican 
fácilmente con los 
investigadores 

• Obtener información del 
mercado 

• Obtener información en el 
interior de la empresa 

• Colaborar con los cuadros 
superiores para fijar objetivos y 
comunicar resultados 

• Colaborar con los investigadores 
para fijar objetivos y 
proporcionar información de la 
empresa o del mercado 

Los investigadores, 

que son personas 
expertas en la 

recogida y tratamiento 
de la información. 

• Contribuir a fijar objetivos 

• Obtener información 

• Analizar información 

• Obtener resultados 

• Preparar informes 

• Proponer acciones 


Fuente: Elaboración propia. 

El investigador debe entender el problema desde el 
principio y desarrollar la investigación para ayudar a su 
cliente. A veces, las empresas no comunican sus objetivos 
explícitamente al investigador, y se limitan a exponer los 
deseos de unas necesidades de información. Los 
investigadores de mercados deben conocer para qué 
quieren sus clientes sus estudios. Existen tres técnicas para 
conocer los objetivos de una investigación comercial. 










• Desmenuzamiento: el investigador pregunta 
abiertamente cuáles son los objetivos de la 
investigación o interpreta el significado de las palabras 
del directivo. 

• Indirecta: el investigador pregunta al directivo qué 

decisiones tomará con los resultados de la 

investigación. 

• Mixta: es una combinación de las anteriores y, 
generalmente, la más usada. 

Las empresas deben tener en cuenta, además, una serie 
de aspectos cuando fijan los objetivos de sus 

investigaciones. En concreto, deben, 

• Informar sobre el proyecto de investigación y 

consultar con quienes puedan beneficiarse de ella, para 
que pongan de manifiesto, si procediera, sus 

necesidades u objeciones. 

• Dejar que el proyecto esté abierto a todo tipo de 
sugerencias que razonadamente puedan hacerse. 

A continuación se muestra una relación de posibles 

objetivos de investigación comercial. 


Cuadro 1.6. Ejemplos de objetivos de 
investigaciones de mercado 


Áreas sobre 
las que se 
investiga 

Algunos tipos de investigaciones que 
se pueden realizar 

Análisis de la 

• Perfil de los compradores. 

demanda 

• Quién compra. 


• Dónde se compra. 







Características 
del mercado 


Análisis de la 
competencia 


Análisis del 

entorno 

general 


Análisis del 

entorno 

interno 


Frecuencia de compra 
Por qué se compra. 

Cuándo compra. 

Cuánto compra. 

Actitudes de los compradores. 
Intenciones de los consumidores 
Influenciadores de las compras. 

Evolución de los estilos de compra 

Tamaño del mercado potencial. 
Identificación de segmentos. 

Tendencias observadas 

Identificación de los competidores. 
Características de los competidores en 
programas de marketing, competitividad, 
recursos. 

Principales puntos fuertes y débiles de la 
competencia. 

Expectativas de competencia en el 
futuro 

Indicadores de coyuntura: empleo, 
inflación, oferta monetaria, tipos de 
interés, crecimiento del PIB, consumo 
interno. 

Legislación; comercial, ambiental, sobre 
productos, seguridad. 

Movimientos de población 
Tendencias culturales y valores de los 
consumidores 
Tendencias tecnológicas 

Análisis de los departamentos de 
marketing, finanzas, producción y 
recursos humanos. 












• Clientes 

• Proveedores 

• Distribuidores 

• Competidores 

• Trabajadores 

Análisis del 
producto 

• Atributos y beneficios percibidos. 

• Cómo podría diferenciarse el producto. 

• Cómo se podrían atraer segmentos. 

• Cómo son de importantes el servicio, la 
garantía. 

• Necesidad de variar la línea de 
productos. 

• Cómo es de importante el envase. 

• Cómo se percibe el producto respecto al 
de la competencia. 

• Conveniencia de diseño de productos. 

• Diseño de envases. 

• Denominación de marcas. 

Distribución 

• Actitudes y motivaciones dentro del 
canal. 

• Diseño del canal más efectivo: 
mayoristas, minoristas, directo. 

• Cuáles son los márgenes apropiados. 

• Colaboración con el distribuidor en 
merchandising para la adopción de 
estrategias push o pulí. 

• Conflictos en los canales. 

• Relaciones de poder. 

Precio 

• Elasticidad de la demanda. 


Políticas de precios. 

Fijación de precios a líneas de productos. 











• Cómo reaccionarán los competidores 
ante las variaciones en los precios. 

Promoción y 
comunicación 

• Estudios de audiencias y soportes. 

• Investigaciones de mensaje. 

• Pretest y post-test publicitarios. 

• Eficacia publicitaria. 

Fuerza de 
ventas 

• Fijación de cuotas, territorios. 

• Rendimiento, motivaciones y 
satisfacción. 

• Asignación óptima de vendedores. 

Valoración de 
resultados 

• Rentabilidad por líneas. 

• Cuotas. 

• Análisis por mercados. 

• Notoriedad de la empresa, producto o 
marca. 

• Imagen de la empresa. 


Fuente: Adaptado de varios autores. 

1.5.4. Formulación el diseño general 
de la investigación 

La relación de objetivos que acaba de enumerarse hace 
referencia a la naturaleza de las materias a conocer, pero no 
aclara cómo debe realizarse la investigación. Las 
investigaciones que desarrollen las organizaciones se 
pueden dividir en dos grandes grupos: exploratorias y 
concluyentes. A su vez, las investigaciones concluyentes 
pueden ser descriptivas o causales, y éstas; cross-section o 
con datos de corte transversal, longitudinales, realizadas 
con muestras estáticas o con datos de panel. Ver el gráfico 
1 . 2 . 
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1.5.4.1. Decidir entre investigación 
expioratoria o conciuyente 

Las investigaciones exploratorias persiguen una 
aproximación a una situación o problema. Se desarrollan, en 
general, cuando los investigadores no tienen conocimientos 
profundos de los problemas que están estudiando. Por 
ejemplo, antes de vender sofás en Alemania conviene saber 
cuál es tamaño medio de la familia, la complexión física del 
alemán medio, si ven juntos o separados la televisión o si 
duermen la siesta. Estos datos permitirán decidir el tamaño 
del sofá, la altura del respaldo, la profundidad del asiento o 
la densidad del relleno de los cojines. 

Las investigaciones exploratorias tienen, por lo general, 
carácter previo a otras investigaciones más complejas. Son 
menos rígidas en cuanto a los procedimientos de recogida 
de información, que no se materializan en procesos o 
herramientas complejas. El objetivo de la investigación no 
se encuentra totalmente cerrado, y a medida que se avanza 
puede ir alterándose. 






































Las investigaciones exploratorias pueden tener por objeto 
los siguientes propósitos, 

• Definir o clarificar conceptos. Por ejemplo, ¿qué 
entiende un consumidor por aceite multigrado? 

• Conocer situaciones, problemas o fenómenos 
con mayor profundidad. Por ejemplo, ¿por qué en 
algunos países latinoamericanos se toma chocolate 
caliente a media mañana, con el calor que hace? 

• Formular hipótesis explicativas o identificar 
causas posibles de fenómenos, hechos o situaciones. 
Por ejemplo, un sofá con el respaldo alto tendrá éxito en 
lugares donde se duerma siesta. La aceptación de un 
sofá con respaldo bajo será elevada en países del norte 
de Europa, donde no se duerme la siesta. 

Las investigaciones concluyentes son más formales que 
las exploratorias. En general, se desarrollan para describir 
situaciones; por ejemplo, conocer los atributos más 
valorados de SEAT, identificar el perfil de consumidores de 
leche Pascual o comparar la imagen de ordenadores 
portátiles IBM y Toshiba son casos de investigaciones 
concluyentes. Las investigaciones concluyentes pueden ser, 
además, descriptivas o causales. 

Las investigaciones descriptivas, como su nombre 
sugiere, explican situaciones y pueden perseguir muchos 
objetivos, entre ellos, 

• Describir las características de grupos, de 
consumidores, empresas, marcas, o intermediarios. 

• Identificar la imagen de productos, marcas o empresas. 



• Encontrar fortalezas y debilidades de empresas, 
productos o competidores. 

• Medir el posicionamiento de bienes y servicios. 

• Segmentar mercados. 

• Medir la eficacia de la comunicación. 

• Diseñar productos, envases o encontrar 
denominaciones de marca. 

• Fijar precios. 

• Controlar los resultados de acciones ya tomadas. 

• Contrastar o verificar hipótesis formuladas en 
investigaciones exploratorias. 

• Desarrollar experimentos. 

Las investigaciones descriptivas pueden ser de varias 
clases. 

• Estudios «cross-section» o estudios en un momento 
dado del tiempo. Este tipo de investigaciones se 
desarrolla con datos obtenidos en un único instante del 
tiempo. Por ejemplo, una sola encuesta en 
establecimientos para medir la calidad de servicio que 
se proporciona, o un sondeo de opinión antes de unas 
elecciones. 

• Estudios longitudinales o estudios a lo largo del 
tiempo. En ellos la obtención de información se realiza a 
lo largo de varios momentos separados en el tiempo. Por 
ejemplo, un fabricante de automóviles podría hacer un 




estudio de posicionamiento de su marca frente a las 
demás cada seis meses. Si se repitiera una encuesta 
para medir la calidad de servicio en un establecimiento 
se trataría de una investigación longitudinal. 

• Estudios a partir de muestras estáticas. En este caso 
se realiza la investigación con una muestra que se 
selecciona exclusivamente para la investigación. Sería 
casi imposible que una nueva selección aleatoria de 
otra muestra posterior tuviera la misma composición, es 
decir, se preguntara a las mismas personas. Un sondeo 
de electoral antes de unas elecciones generales es un 
buen ejemplo de investigación con muestra estática. 

• Estudios de panel. En este caso se utiliza una muestra 
que proporciona información con carácter periódico. Por 
ejemplo, los consumidores que pertenecen a un panel o 
a un ómnibus suministran información mensualmente o 
trimestralmente sobre sus actos de consumo. 
Generalmente, los paneles se renuevan con personas 
distintas, cada cierto tiempo, pero se mantiene la 
representatividad del conjunto. 

Finalmente, las investigaciones causales tratan de 
encontrar relaciones causa efecto entre unas variables que 
las empresas controlan y pueden modificar, como los precios 
o los atributos de los productos, y unos resultados. Por 
ejemplo, Carrefour puede rebajar el precio de un producto 
con la esperanza de que sus ventas aumenten, porque crea 
que existe una relación causa-efecto entre el precio y las 
ventas, tal como propone la teoría económica. Pascual 
podría alterara el diseño de sus envases de leche y observar 
si las ventas reaccionan ante el cambio. 

Las diferencias de concepción, diseño y desarrollo entre 
las investigaciones exploratorias y las concluyentes - 



fundamentalmente las descriptivas- aparecen en el cuadro 
1.7. 


Cuadro 1.7. Diferencias entre investigaciones 
exploratorias y concluyentes 


Origen de las 
diferencias de 
planteamiento 
y de desarrollo 
en las 

investigaciones 

Investigaciones 

exploratorias 

Investigaciones 

concluyentes 

Formulación de 
objetivos 

• Objetivos poco 
definidos 

• El objetivo 
principal suele 
ser aproximarse 
a un problema o 
situación 

• Frecuente 
redefinición de 
objetivos 
durante fases 
iniciales 

• Objetivos de la 
investigación 
bien definidos 
desde el principio 

• Objetivos 
frecuentes: 
verificar 
hipótesis, 
encontrar 
relaciones, medir 
resultados 

Definición de la 
información 
necesaria para 
desarrollar la 
investigación 

• Vaga 

• Posiblemente 
cambiante 

• Perfectamente 
definida 

• Inalterable 

Obtención de las 
muestras 

• Pequeñas 

• Poco 

representativas 

• Selección 
simple 

• Grandes 

• Representativas 

• Selección 
compleja 

• Aleatorias 











• No aleatorias 


Técnicas de 
análisis de datos 

• Cualitativas 

• Sencillas 

• Cuantitativas 

• Complejas 

Resultados / 
Conclusiones 

• Orientativas 

• No se pueden 
extrapolar 

• Concluyentes 

• Se pueden 
extrapolar 

Utilidad de la 
investigación 

Obtener 

información para 
desarrollar 
investigaciones 
concluyentes 

Tomar decisiones 

Desarrollo del 
proceso de la 
investigación 

• Flexible 

• Admite 
improvisación 

• Adaptable a los 
hallazgos 

• Formal 

• No modificable 


Fuente: Elaboración propia. 


Optar entre un tipo u otro de investigación no es una tarea 
difícil. El siguiente gráfico muestra el proceso de elección. 






















Gráfico 1.3. Proceso de elección del tipo de 

investigación 

1.5.4.2. Definición de ia información necesaria 

La información que las organizaciones necesitan varía con 
los objetivos de la investigación que pretenden desarrollar, y 
de su naturaleza. Existen dos clases de fuentes de 
información: primaria y secundaria. 

• La información primaria es la que no existe antes de 
desarrollar una investigación y se crea específicamente 
para ella, a través de observaciones, encuestas, 
entrevistas o experimentos. La información primaria 
puede obtenerse con técnicas cuantitativas o 
cualitativas. Se llaman cuantitativas porque la 
información obtenida se trata con técnicas de análisis 
de datos. La cualitativa generalmente se interpreta sin 
ayuda de herramientas estadísticas o matemáticas. A 
través de técnicas cuantitativas, como una encuesta 
telefónica sobre intención de voto, antes de unas 
elecciones, se obtiene información primaria. Otras veces 
puede obtenerse información tras aplicar técnicas 
cualitativas que se aplican a grupos, como la dinámica 
de grupos, o a personas, individualmente, como las 
entrevistas, la pseudocompra o las técnicas proyectivas. 

• La información secundaria es la que está disponible 
antes de que surja la necesidad de contar con ella para 
llevar a cabo la investigación que la necesita. Esta 
información puede haber sido generada por la propia 
empresa, o por terceros, y entonces recibe los nombres 
de información secundaria interna o externa, 
respectivamente. Por ejemplo, los datos del Instituto 
Nacional de Estadística, como las encuestas de 



presupuestos familiares, las pirámides de edades, las 
estructuras de gastos por edades o Comunidades 
Autónomas, la información que aparece en internet, en 
la prensa, anuarios, directorios y bibliografía en general, 
etc. constituyen ejemplos de información secundaria 
externa. 

Los sistemas de información de marketing que crean las 
empresas para conocer y analizar el entorno, los resultados 
de investigaciones previas o los datos de una empresa, 
procedentes de su contabilidad o mecanismos de control de 
gestión, también son fuentes de información secundarias, en 
este caso internas. 

Finalmente, las empresas que deseen desarrollar 
investigaciones causales necesitan información primaria 
obtenida y/o tratada experimentalmente. Para ello pueden 
acudir a experimentos de laboratorio o experimentación 
estadística, que consiste, esta última, en analizar 
cuantitativamente los resultados que se atribuyen a 
medidas tomadas por las empresas, por ejemplo, las 
alteraciones de los precios, o de los diseños de los envases, 
sobre las ventas. 

En general -con algunas reservas- puede proponerse que, 

• Las investigaciones exploratorias se desarrollan, 
generalmente, a partir de información cualitativa o 
de información secundaria. 

• Las investigaciones descriptivas normalmente 
necesitan de datos que permitan observar los 
comportamientos, creencias, hábitos, actitudes, hechos, 
efectos, etc. que proporcionan las fuentes primarias. 



• Las investigaciones causales requieren el empleo de 
técnicas de experimentación causal, de laboratorio o 
estadísticas. Emplean, generalmente, información 
primaria. 

1.5.4.3. Obtención de información 

Para desarrollar investigaciones, las organizaciones deben 
encontrar información, que debe reunir las siguientes 
características. 

• Actualidad. La información debe ser lo 
suficientemente próxima como para poder explicar el 
pasado reciente y el momento presente. Esta 
característica es especialmente importante cuando se 
trata de fuentes secundarias. En ocasiones las bases de 
datos, los directorios o las estadísticas pueden contener 
datos anticuados e inútiles. 

• Disponibilidad. Es necesario que la información sea 
accesible en el momento en que surge la necesidad de 
su obtención, porque sea pública, se pueda adquirir a 
algún proveedor pagando un precio, o sea factible 
recogerla en el mercado a través procedimientos 
diversos, como encuestas, entrevistas, etc. 

• Precisión. La información debe ser un fiel reflejo de la 
realidad, sin errores. Para ello deberá hacerse una 
buena selección de fuentes secundarias, fiables, o se 
prestará especial cuidado al proceso de obtención de 
información primaria. 




Suficiencia y relevancia. La información valorada 
por su abundancia, contenido y matices debe permitir 
desarrollar el estudio deseado. No basta con tener 



mucha información. Es muy importante tenerla 
detallada. 


1.5.4.4. Selección de muestras. 

Cuando se debe obtener información primaria procedente 
de una población ésta no se investiga en su totalidad, de la 
misma forma que para hacer un análisis de sangre no se 
extrae la totalidad de la misma. Unos pocos centímetros 
cúbicos son suficientes. Cuando se trata de investigaciones 
comerciales se emplean muestras por las siguientes razones: 

• Economía. Estudiar una población completa es, 
obviamente, más caro que hacerlo con una parte de 
ella, tanto si el estudio se hace a través de encuestas 
personales, postales o telefónicas o entrevistas. 

• Rapidez. Estudiar toda la población requiere más 
tiempo que analizar una parte de ella. Supone que hay 
que imprimir más cuestionarios, realizar más 
entrevistas, completar el censo, tabular y depurar más 
datos, etc. 

• Precisión. Cuando se estudia un censo o población 
total, no surgen, obviamente, errores de muestreo. Sin 
embargo, éstos no son la única fuente de error. En un 
censo se necesitan más entrevistadores, más personal 
administrativo, etc. Cuanto más amplio sea un estudio, 
más difícil será contar con personas con alta 
cualificación y más difícil se hará la supervisión, 
circunstancias que suponen que la calidad del trabajo 
en general será menor. Otra consideración es que el 
censo llevará más tiempo y en este período puede 
haber cambios sociales, coyunturales, etc. Un censo 
incorpora mayores errores ajenos al muestreo y, en 



conjunto, puede ser menos preciso que el estudio de 
una muestra. 

• Accesibilidad. Frecuentemente no se conoce con 
exactitud cuántos elementos componen la población, o 
bien no es posible acceder a todos debido a su status, 
distancia, etc. 

• Simplicidad. En ocasiones no se necesita conocer con 
gran exactitud la realidad que se estudia, sino que es 
suficiente con una idea aproximada: por ejemplo, es 
posible que no haga falta saber el porcentaje exacto de 
usuarios de un servicio o que consumen un producto, 
sino únicamente si están por encima del 10%, o no, 
etcétera. 

• Imposibilidad. En ocasiones, el estudio del censo no 
es posible si implica la destrucción del elemento de 
muestreo. Esto ocurre cuando se toman muestras de 
unidades de producto procedentes de un lote y se 
examinan para comprobar su calidad; por ejemplo, se 
prueba una muestra de bolsas de patatas fritas para 
comprobar su estado y calidad. Lógicamente, no se 
puede probar toda la producción, sino sólo una parte. 

• Congruencia o coherencia con los objetivos de la 
investigación. Cuando se lleva a cabo un test de 
mercado se prueba un producto en una zona reducida, 
que constituye una parte de la totalidad del mercado. Si 
los resultados fueran satisfactorios se difundiría en la 
totalidad del mercado. Un test de mercado, por 
definición, se ensaya sólo en una parte del mismo, con 
una muestra representativa de consumidores. 


El muestreo también tiene sus inconvenientes porque. 



• Las muestras no proporcionan información de cada 
elemento de la población sino del conjunto, o de 
grupos. 

• El muestreo requiere gran cuidado en su diseño y 
preparación. Necesita menos trabajo material, en 
comparación con un censo, pues hay que recoger y 
tratar menos cuestionarios, pero requiere 
encuestadores, inspectores, supervisores y diseñadores 
muy cualificados. 

Las empresas pueden aplicar distintos tipos de muestreo. 
Puede ser probabilista, es decir, que la selección de los 
individuos se haga al azar, o no probabilista. La diferencia es 
que en muestreo aleatorio los resultados se pueden inferir. 
En muestreo no aleatorio no se pueden inferir, no cabe la 
extrapolación de resultados. 


Cuadro 1.8. Características que debe reunir la 

información 


Característica 
deseable de 
la 

información 

Significado de 
la 

característica 

Cómo conseguirla / 
Actuaciones 

Actualidad 

Información 
próxima en el 
tiempo, reciente 

• Prestar atención a la 
fecha de obtención de 
los datos 0 a su 
actualización 

Disponibilidad 

Acceso 

• Planificar de las 


inmediato a la 

necesidades de 


información 

información 


cuando sea 

• Comprobar la 


necesaria 

existencia de 



proveedores 














• Verificar la 
posibilidad de 
obtenerla en el 
mercado 

Precisión 

Datos ausentes 
de errores 

• Seleccionar fuentes 
secundarias fiables 

• Preparar 
cuestionarios bien 
diseñados 

• Realizar un análisis 
de datos minucioso 

• Realizar un trabajo 
de campo de calidad 

• Utilizar escalas de 
medición válidas 

Suficiencia y 
relevancia 

• Abundancia 
de datos 

• Abundancia 
de matices 

• Seleccionar la fuente 
que proporcione estas 
características 

• Examinar las fuentes 
de datos alternativas 
existentes 


Fuente: Elaboración propia. 


1.5.4.5. Decidir i a técnica de anáiisis de i a 
información 


La información recogida en una investigación puede ser 
de diferente naturaleza; cualitativa o cuantitativa. La 
cualitativa son generalmente juicios, opiniones y 
valoraciones dadas por personas, frecuentemente en 
número reducido. La información se analiza en términos 
cualitativos, interpretando el significado y las implicaciones 
de las respuestas o juicios. Raras veces tienen aplicación los 










métodos matemáticos o estadísticos, incluso técnicas tan 
simples como los diagramas o los gráficos. 


Respecto a las técnicas de análisis de información, 
cualquiera que sea su naturaleza, debe tenerse en cuenta 
que forman parte del diseño de la investigación, en función 
de los objetivos perseguidos. En cada estudio se fijan unos 
objetivos específicos. Las técnicas que pueden ser 
adecuadas para medir un posicionamiento exigen un 
determinado tipo de datos, que no coincide con los 
adecuados para hacer un estudio de segmentación. Ni los 
datos ni las técnicas de análisis son intercambiables. 

En realidad, las investigaciones habría que planificarlas 
«desde el final» es decir, en función de lo que se desea 
medir debe identificarse herramienta de análisis de datos 
adecuada, que a su vez determina el tipo de datos que 
necesita, y en función de éstos habría que diseñar las 
metodologías para su obtención. De acuerdo con todo ello se 
planificaría y evaluaría el coste de la investigación. 


1.5.5. Presupuestar la investigación 

Una vez perfilado un proyecto de investigación y la 
metodología que se seguirá, el siguiente paso es su 
presupuestación. Para valorar su coste económico la 
empresa debe decidir si es ella quien lo llevará cabo o lo 
encargará a un tercero. 

El objeto de plantearse esta disyuntiva es que en la 
valoración de un proyecto cualquier investigación 
desarrollada interna o externamente tiene un coste, que 
puede ser de oportunidad, o explícito o desembolsadle. 



Las empresas pueden dedicar parte de sus recursos 
humanos a una investigación que emplee información 
secundaria. No se debe creer que esta investigación no tiene 
coste. Puede que no suponga ningún desembolso, pero se 
incurre en un coste de oportunidad, medido por la 
facturación del tiempo internamente dedicado al estudio. 
Para estimar un presupuesto deben considerarse los 
siguientes aspectos. 


Cuadro 1.9. Elementos a considerar en la 
presupuestación de investigaciones 


Factores a 
considerar 

Clases 

Tiempo 

• Interno; dedicado por la 
empresa 

• Externo; facturado por el 
investigador 

Costes 

• Desplazamientos y dietas 

• Materiales y consumibles 

• Recogida de información 

• Trabajos subcontratados 

• Tratamiento de información 

Calendario de pagos 

• Pago al final de la investigación 

• Pagos en función de resultados 

• Pagos periódicos 

Presupuesto 

• Abierto o revisable 

• Cerrado o fijo 


Fuente: Elaboración propia. 


1.5.6. Tomar la decisión 
















Las decisiones empresariales se toman en condiciones de 
riesgo. Cuanto mayor sea el riesgo, más difícil será decidir. 
Para reducir la incertidumbre se recoge información. Si el 
coste de recoger la información es menor que los beneficios 
que se deriven de unas mejores decisiones, esa información 
merece la pena. Algunos métodos de decisión que se basan 
en el valor de la información son los siguientes: 

• El método del ahorro supone que la dirección puede 
hacer una estimación del coste de una decisión errónea. 
Se basa en que los decisores conocen las 
probabilidades de ocurrencia de una decisión correcta y 
el coste estimado de los errores. Veamos un ejemplo: 

Si una decisión no acertada puede tener un coste de 
1.000.000 de €, si no se dispone de más información existe, 
en principio, un 50% de probabilidades de éxito o fracaso. El 
coste esperado de la pérdida es 1.000.000 x 0,5 = 500.000 
€. 


Si se recogiera información que costara 100.000 € y la 
probabilidad de fracaso se redujera al 25%, la pérdida 
esperada sería ahora de 1.000.000 x 0,25 = 250.000 €. La 
investigación que cuesta 100.000 € reduce las pérdidas 
esperadas en 250.000 €. Desde este punto de vista 
merecería la pena llevarla a cabo. 

El método del ahorro propone que deben llevarse a cabo 
aquellas investigaciones cuyo coste sea menor que el ahorro 
derivado de una reducción de las pérdidas (que podrían ser 
consideradas como mayores ingresos). 

• La rentabilidad de la inversión es un procedimiento 
muy simple para decidir si una investigación interesa. 
Consiste en relacionar el valor esperado de sus 
beneficios con su coste. Por ejemplo, si una 



investigación reportara 500.000 € de beneficios, con 
probabilidad 0,8, y costara 1.000.000 €, la rentabilidad 
R sería: 

R = Beneficios ■ Probabilidad de ocurrencia / coste. 

R = (0,8 ■ 500.000) / 1.000.000 = 0,40 

El método no aporta demasiadas luces para tomar 
decisiones, pues se limita a calcular una tasa de 
rentabilidad, que no se sabe a priori cuánto debe valer para 
que una investigación sea aceptada o rechazada. Si el 
método tuviera alguna utilidad, sería para jerarquizar 
proyectos de investigación, tras la comparación de sus 
rentabilidades. 

Los dos métodos expuestos tienen además una limitación 
muy grande que tiene que ver en cómo se estiman las 
probabilidades. Se supone que son subjetivas, lo que hace 
recelar sobre su utilidad práctica. 

• El método del valor actual neto es utilizado en 
finanzas para decidir si una inversión es rentable o no. 

n 

VAN=-G + 5^Qj/(I + k)j 
j-i 

En esta expresión G representa el gasto inicial en la 
investigación, Q son los flujos de caja que se genera a lo 
largo del tiempo, medidos a través de la diferencia entre los 
ingresos y los gastos; n es el número de años. K es el tipo de 
actualización. Sin VAN > 0, se lleva a cabo la investigación. 
En caso contrario no interesa. 

En la práctica las empresas desarrollan investigaciones 
cuando se encuentran razonablemente e intuitivamente 
seguras de que los beneficios que se derivarán de ellas 
superarán los costes. 



Cuadro 1.11. Métodos para la toma de decisiones 


Método 

Concepto 

Criterio de decisión 

Método de 
ahorro 

Compara el coste de 
la investigación con el 
coste esperado de las 
pérdidas si no se lleva 
a cabo la 
investigación 

Si el coste de la 
investigación reduce 
las pérdidas en mayor 
medida, se lleva a 
cabo 

Rentabilidad 
de la 
inversión 

Compara el beneficio 
esperado de una 
investigación con su 
coste 

Si el beneficio 
esperado es igual o 
mayor que los costes 
se lleva a cabo la 
investigación 

Valor actual 
neto 

Compara el flujo 
actualizado de 
rendimientos 
derivados de la 
investigación con su 
coste 

Si el valor actual neto 
es positivo 0 nulo se 
lleva a cabo la 
investigación 


1.5.7. Resultados y presentación de 
informes 

Una vez concluida una investigación, se entregará el 
trabajo en la forma que se haya acordado. Generalmente el 
investigador expone su trabajo a una audiencia de su 
cliente, personas interesadas en él, aparte de la entrega de 
un documento escrito. 

Además el investigador debe entregar a su cliente un 
resumen de la investigación que responda al siguiente 
contenido: 

















• Naturaleza del problema analizado y objetivos de la 
investigación. 

• Metodología seguida, que hará referencia a la 
obtención de información y a su tratamiento. En 
concreto debe explicar la naturaleza de las fuentes de 
información, el método seguido en su recogida y cómo 
se han seleccionado las muestras. También debe 
explicar cómo se ha tratado la información desde el 
punto de vista de las técnicas utilizadas y su 
justificación como las adecuadas para tratar los datos. 

• Exposición de resultados, conclusiones y 
recomendaciones, diferenciando muy claramente lo 
que es conclusión del estudio de lo que es 
recomendación personal. 

En la exposición oral el investigador debe resultar creíble, 
debe despertar confianza y convencimiento en su audiencia, 
y sobre todo, no aburrirla. En la presentación es conveniente 
servirse de gráficos, transparencias o mapas, para ilustrar 
las ideas que se transmitan. 


1.5.8. Evaluación de la investigación 

Una vez tomada la decisión de desarrollar una 
investigación se corre el peligro de olvidar su control, pues 
se considera un gasto ya realizado o comprometido. En 
realidad, una investigación no debe evaluarse cuando ya se 
ha finalizado, sino que debe ser controlada en todas sus 
fases, como ocurre con un tratamiento médico. De lo 
contrario, esperar al final del proceso podría ser demasiado 
tarde, porque ya no se podrían tomar medidas correctoras. 
Los métodos para evaluarlas son los siguientes. 



Check lists. Una lista de comprobación es una 
herramienta muy simple y útil que se aplica en 
cualquier investigación de forma automática. Consiste 
en un conjunto de preguntas relativas al proceso de 
planificación y puesta en marcha de una investigación, 
a las que hay que dar respuesta periódicamente, 
mientras se desarrolla la investigación. Son las 
siguientes. 

1. Valoración de la adecuación de la investigación a los 
objetivos de conocimiento para solucionar el 
problema. 

2. Identificación y valoración de la utilidad de todas las 
fuentes de información (primarias, secundarias, etc.) 
consideradas en el proyecto de investigación. 

3. Consideración de la omisión de alguna fuente de 
información importante. 

4. Juicio sobre la representatividad, dimensión y 
conveniencia de la muestra empleada. 

5. Adecuación de la técnica de tratamiento de datos 
para alcanzar los objetivos de conocimiento de la 
investigación. 

Comité de asesores. Lo constituyen representantes 
de alto nivel de las áreas funcionales de la empresa, 
tales como marketing, finanzas, producción, ventas, 
directores de marcas, de productos, de recursos 
humanos, etc. El comité de asesores no se limita a 
evaluar una investigación al final, sino que también la 
controla mientras se desarrolla. Controla todo el 
desarrollo de la investigación, de principio a fin. Valora 
la utilidad de la investigación paso a paso. No entra en 
detalle a juzgar datos, o técnicas de análisis, sino que 
hace un seguimiento de la utilidad de la investigación 



para mejorar la gestión de la organización. Por este 
motivo, es muy importante que en la fijación de 
objetivos de las investigaciones intervengan todos 
aquellos departamentos o personas que puedan verse 
interesados o afectados por ellas. 

1.6. LA ORGANIZACIÓN DE UN 
DEPARTAMENTO DE 
INVESTIGACIÓN COMERCIAL 
EN UNA EMPRESA 


Las empresas que deseen desarrollar estudios o 
investigaciones pueden optar por crear sus propios 
departamentos o por contratar a empresas especializadas 
para que los desarrollen. Un departamento de investigación 
comercial de la propia empresa puede resultar muy 
interesante, porque la conoce muy bien. Los institutos, o 
empresas especializadas, tratan de forma excelente la 
información, pero sus informes pueden resultar demasiado 
asépticos. 

Un departamento de investigación comercial interno se 
justifica por las fuentes de datos de que dispone y el 
volumen global de información a tratar. Una pequeña 
empresa que necesite información puntual y esporádica no 
debería crear un departamento de investigación comercial. 
Aquellas que lo constituyan deben respetar unas normas. 

• No es conveniente que el departamento de 
investigación esté integrado en el de marketing, 

porque no se garantizaría la objetividad de los estudios 
a desarrollar y de las recomendaciones que de él 



pudieran emanar. Desde un punto de vista organizativo 
debe ser staff, o asesoría, y no tener autoridad de línea. 
No debe tener poder de decisión, aunque podría 
intervenir e implicarse en los procesos de toma 
decisiones. 

• Conviene que el departamento de investigación 
comercial dependa de la gerencia para que ésta tenga 
información directa sin estar mediatizada por ningún 
departamento de la empresa, razón que refuerza la 
conveniencia de que sea staff. 

• La dirección de la empresa necesita otras 
informaciones, como indicadores coyunturales, datos 
macroeconómicos. Sistemas de Información de 
Marketing, bases de datos internas, etc. La obtención de 
información debe recaer en un departamento 
especializado, no en un área funcional de la empresa 
como la de marketing. 

1.7. OBSTÁCULOS Y FRENOS A 
LA ADOPCIÓN DE LA 
INVESTIGACIÓN COMERCIAL 


La investigación comercial es una actividad esencial para 
la gestión de la empresa. A pesar de su indudable utilidad, 
su implantación aún encuentra frenos y resistencias. Existen 
diversos trabajos, algunos realizados hace más de treinta 
años y que siguen siendo actuales, que han tratado esta 
problemática, cuyos contenidos se estructuran y resumen a 
continuación. Los frenos y resistencias a la implantación de 
la investigación comercial se pueden sintetizar en siguiente 
cuadro. 



Cuadro 1.11. Problemas para la adopción de la 
Investigación Comercial 


Problemas 

Causas de los problemas 

Dificultades 

de 

entendimiento 

entre 

directivos e 
investigadores 

• Los investigadores son personas 
sistemáticas, que emplean métodos o 
modelos para solucionar los problemas y 
un orden en la búsqueda de información. 

• Los directivos suelen ser intuitivos, que 
tienden a hacer las valoraciones desde 
un punto de vista emotivo o afectivo. 
Confían mucho en su experiencia; son 
menos propensos a la investigación, y 
están acostumbrados a recibir 
información breve y concisa. 

Estructura 
organización 
de la empresa 
muy 

jerarquizada, 
con muchos 
niveles en el 
organigrama 

• Excesivo número de niveles 
organizativos que dificultan la 
comunicación vertical y horizontal. 

• Falta de un sistema de comunicación en 
la empresa, que impide fijar objetivos 
correctamente. 

Mala 

planificación y 
desarrollo de 
la 

investigación 

• Objetivos mal definidos. 

• Falta de habilidad para presentar 
resultados. 

• Falta de habilidad o incompetencia del 
investigador. 

• Preocupación por investigar temas 
banales o hechos no relacionados con la 
empresa. 

• Insistencia en métodos rigurosos 
demasiado complicados para solucionar 











problemas que no lo son tanto. 


Desconfianza 
ante las 
técnicas de 
análisis de 
datos 

• Por falta de desarrollo teórico o 
conceptual o por excesiva novedad. 

• Por inadecuación al tipo de información 
que van a tratar. 

• Por inutilidad para alcanzar los objetivos 
de la investigación. 

Actitudes 
negativas 
hacia la 
investigación 
comercial 

• Los directivos de una empresa pueden 
ver en la investigación comercial una 
amenaza o intentos de fiscalización de su 
actuación. 

• Presiones del día a día. Los responsables 
de las empresas suelen estar demasiado 
ocupados resolviendo los problemas 
cotidianos y creen que la investigación 
hace perder tiempo. 

• Problemas de naturaleza ética. Algunos 
directivos manifiestan sus dudas sobre la 
ética de los investigadores, en el sentido 
de que en sus conclusiones pueden 
tender a confirmar o reforzar sin 
fundamentos reales las impresiones de 
quien ha encargado el trabajo. 


Fuente: Elaboración propia. 


1.8. CONTRATACIÓN EXTERNA O 
EJECUCIÓN INTERNA 

Las organizaciones pueden plantease la posibilidad de 
realizar ellas mismas las investigaciones o bien contratar a 
un instituto especializado. La decisión entre esta disyuntiva 








depende de la capacidad de poder desarrollar la 
investigación con la calidad requerida. Si una empresa 
considerara que no es capaz de llevar a buen término la 
investigación deberá contratar a un tercero, considerando 
criterios económicos, de capacidad, credibilidad y eficiencia. 

• Precio. Las investigaciones de mercado suelen ser 
caras. Una empresa puede optar por desarrollar 
internamente una investigación cuando considere que 
no puede pagar a un instituto la cantidad fijada para la 
investigación. Sin embargo, un precio elevado no es 
sinónimo de caro, porque también hay que evaluar la 
calidad y los aspectos ya descritos en este apartado. En 
cualquier caso, resulta conveniente examinar distintos 
presupuestos antes de tomar la decisión. 

• Coste. Generalmente, las empresas especializadas en 
investigaciones de mercado operan con costes más 
bajos, sobre todo los relativos a la obtención de 
información en el mercado, como la realización de 
encuestas en sus diversas acepciones. Suele ser más 
barato encargar a un tercero especializado la obtención 
de información externa que buscarla desde la propia 
organización. 

• Capacidad. Aunque una empresa posea un 
departamento propio de investigación comercial, es 
posible que el trabajo lo desborde. En estas 
circunstancias se debe acudir a terceros para desarrollar 
las investigaciones. 

• Experiencia. Tras largos años de actividad los 
investigadores adquieren conocimientos muy 
profundos. Además, es frecuente que se especialicen en 
tipos de investigaciones. Así, es posible encontrar 
empresas más competentes en estudios cualitativos; 



otras pueden serlo en cuantitativos o desarrollando 
trabajo de campo. 


• Habilidad personal. Los institutos de estudios de 
mercado poseen habilidades especiales para entrar en 
contacto con personas, encuestan entrevistar, 
solucionar situaciones delicadas, etc., que no suelen 
tener la mayoría de las empresas, aunque en éstas se 
tengan conocimientos elevados de técnicas de 
investigación de mercados. 

• Competencia. Seguramente un instituto 
especializado desarrolle mejor una investigación porque 
posea habilidades investigadoras mayores que las de la 
empresa que reclama sus servicios. Por razones de 
eficiencia puede ser mejor contratar investigadores 
externos. 

• Prestigio. Los institutos de estudios de mercados 
suelen estar muy prestigiados y constituyen una 
garantía de calidad de las investigaciones. Ese prestigio 
garantiza también la credibilidad de las 
investigaciones. 

• Imparcialidad. Cuando una empresa debe efectuar 
una investigación, es posible que surjan algunos 
conflictos dentro de ella, porque algún área puede 
sentirse fiscalizada por otra. Contratar a un tercero 
evita recelos y proporciona credibilidad al proyecto de 
investigación. 


1.9. LA CONTRATACIÓN DE LOS 
ESTUDIOS DE MERCADO EN 



LA PRÁCTICA. LAS 
RECOMENDACIONES ESOMAR 

Las empresas deben y pueden buscar buenos 
investigadores. ESOMAR es la Asociación Europea para 
Estudios de Opinión y Marketing ha desarrollado normas y 
consejos que las empresas pueden tener en cuenta para 
encontrar buenos investigadores, tanto en el mercado 
nacional como en el internacional. Los recelos ante su ética 
se disipan ante la existencia de un código deontológico, 
desarrollado por la Cámara de Comercio Internacional y 
ESOMAR, al cual los investigadores se adhieren. 

Muchas organizaciones no desarrollan las investigaciones 
comerciales. Los motivos pueden ser diversos; se trata de 
empresas de dimensión reducida y estructura organizativa 
muy simple, realizan las investigaciones con carácter 
esporádico o no cuentan con personas capaces de 
afrontarlas. Entonces las contratan a institutos 
especializados. ESOMAR proporciona unas recomendaciones 
para contratar con garantía los estudios de mercado. Se 
dividen en normas generales y en normas particulares. 

1.9.1. Normas generales 

Los clientes que desean encargar estudios de mercado 
deben dirigirse a las empresas que los realizan 
proporcionando información sobre una serie de aspectos, en 
parte ya expuestos en este capítulo. 

La Asociación Europea de Estudios de Mercado y Opinión 
(ESOMAR) recomienda a las empresas que deseen encargar 
estudios de mercado que recojan en las propuestas de 



investigación los siguientes aspectos. Las empresas deben 
(AEDEMO, Guía Práctica para la contratación de estudios de 
mercado, 1987): 


• Explicitar la naturaleza de los problemas que motivan 
las investigaciones. 

• Delimitar los objetivos de las investigaciones y, en 
concreto, el orden de prioridades de la investigación, el 
nivel de precisión de los datos y el grado de extensión o 
profundidad de las recomendaciones que pudieran 
darse a partir de los resultados obtenidos. 

• Proporcionar toda la información básica disponible. 

• Aclarar los compromisos que puedan afectar al diseño 
de la investigación como calendarios o plazos de 
ejecución. 

• Por razones de ética el cliente, en caso de solicitar 
varias ofertas de estudios de mercado, no debe revelar 
el importe de las que hagan a otros oferentes. 

• Definir los objetivos del estudio, describiendo la 
naturaleza del problema que motiva la investigación, 
los objetivos que se persiguen con la misma, la 
naturaleza de la información que se va suministrar 
(encuesta, observación, etc.) y qué utilidad reportará el 
estudio que se encarga. 

• Concretar las especificaciones técnicas, que se 
materializan en el diseño de la muestra, qué 
información se recogerá, cómo se analizará, el 
calendario previsto, etc. 

• Concretar el presupuesto y la forma de pago. 



• Identificar a los interlocutores por ambas partes. 

• Recoger en un contrato todos los acuerdos 
mencionados con el compromiso de observar las normas 
del Código Internacional. 

1.9.2. Normas particulares. Lista de 
puntos que deben ser 
considerados ai planificar y 
encargar un proyecto de 
investigación 

ESOMAR recomienda, al margen de lo expuesto en 
párrafos anteriores, concretar una serie de aspectos relativos 
a las muestras, los datos, el análisis de la información, la 
presentación de los informes, el calendario, el presupuesto y 
otros aspectos (AEDEMO, Guía práctica para la contratación 
de estudios de mercado, 1987). 

1.9.2.1. Muestras 

Respecto a ellas, las empresas de estudios de mercado 
deben definir: 

• El universo de referencia o conjunto de población 
del que se extraerá la información. Por ejemplo, amas 
de casa, propietarios de coches, clientes de un hotel, 
jóvenes de 15 a 25 años, etc. 

• El método de selección de muestras, que podrá 
ser aleatorio o al azar, estratificado, por cuotas, rutas, 
secuencial, de conveniencia, por bola de nieve, etc. 



• La muestra efectiva. No todas las personas a las que 
se les solicita información la proporcionan. En 
encuestas por correo la tasa de respuestas viene a ser 
de un 10%. Así, si hiciera falta contar con 2.000 
respuestas deberían enviarse encuestas a 20.000 
personas. 

• Los criterios y metodología para la localización de la 
muestra. Por ejemplo, a través de un censo, de una 
base de datos, al azar en la calle, en un establecimiento 
por el método de la detención, en el domicilio, etc. 

• El nivel de continuidad esperado. En algunas 
investigaciones el contacto con la muestra no es único. 
Se la visita con regularidad o periódicamente 
proporciona información, como sucede con los 
panelistas. Deben hacerse estimaciones sobre el grado 
de cooperación, para arbitrar medidas para mantenerla. 

i.9.2.2. Datos 

El investigador debe concretar al cliente: 

• El método que empleará para recoger la información. 
Por ejemplo, entrevistas, encuestas observación, etc. 

• Si puede identificar al cliente. En caso afirmativo, 
deberá saber si puede hacerlo antes o después de 
obtener la información. 

• Si empleará datos secundarios, es decir, información 
existente, generalmente publicada, en el momento de 
realizarse la investigación. 



• Los lugares donde obtendrá la información: en 
viviendas, estaciones, en la calle, en grandes 
almacenes, aeropuertos, colegios, hoteles, etc. 

• La forma de recoger la información: en 

cuestionarios, cintas de audio, de vídeo, etc. 

• Los incentivos que se darán a los encuestados, como 
pequeños obsequios, cheques regalo de grandes 
almacenes, etc., y cuál de las partes los proporcionará. 

• La identificación de las personas que recogerán la 
información, así como su cualificación y experiencia: 
sicólogos, sociólogos, encuestadores profesionales, 
estudiantes, empresas especializadas en labores de 
campo, etc. 

• Cómo se hará la supervisión del trabajo de campo, y 
quién la hará (generalmente un jefe de campo). 

• Cómo se darán las instrucciones (por escrito, 
oralmente) a quienes deban recogen la información y 
quién las dará. 

• Instrucciones sobre la cumplimentación de los 
cuestionarios, si procediera, así como el diseño 
facultativo de cuestionarios piloto. 

• Descripción del material auxiliar, como prototipos, 
muestras, fotos, catálogos, etc. 

1.9.2.3. Análisis y presentación de informes 

Las empresas que realizan estudios de mercado deben 
concretar: 



• El formato de sus informes: por escrito, en soporte 
magnético, cintas o disquetes de ordenador, o ambas 
alternativas simultáneamente. 

• La frecuencia de los informes periódicos que deban 
ser emitidos, en caso de investigaciones que lleven un 
tiempo considerable. 

• El procedimiento de validación de las muestras 
obtenidas. Por ejemplo, tratándose de encuestas podría 
ser el teléfono del encuestado, para comprobar que las 
respuestas no han sido inventadas. 

• Los procedimientos cuantitativos, como técnicas 
estadísticas, modelos matemáticos, etc., que se 
emplearán, así como una explicación de sus 
fundamentos y forma de interpretar los resultados que 
se obtienen tras su aplicación. 

• Si procediera, debe proporcionarse un listado de 
personas o empresas que hayan proporcionado 
información. 

• El número de copias de la investigación que se 
entregarán al cliente. 

• Cómo se hará la presentación del estudio: quién la 
hará, dónde y cuándo, tanto del estudio total como de 
las fases parciales, si las hubiera. Se detallará si será 
oral o escrita. 

• Destino que se dará a los soportes de información: 
cintas, cuestionarios, etc. 


1.9.2.4. Presupuestos y aspectos legales 



Las empresas de estudios de mercado deben acordar con 
sus clientes, 

• El coste del proyecto de investigación total o de sus 
fases, si las hubiera. 

• Las condiciones que deben darse para proceder a una 

revisión del presupuesto. 

• Los costes de los trabajos adicionales que 

pudieran surgir (copias de disquetes, reuniones 
adicionales, etc.) y sobre cuál de las partes recaerán. 

• Si el presupuesto es definitivo o provisional, y la 
forma de pago. 

Además, deben concretarse algunos aspectos legales, 
como: 

• Propietario del copyright. 

• Responsabilidades en caso de uso de prototipos que 
puedan resultar perjudiciales, por ejemplo cuando se 
trata de pruebas de producto. 

• Acuerdos para publicar parte de los resultados, por 
parte del investigador, para ser expuestos en 
congresos, reuniones profesionales y publicaciones 
científicas o de divulgación. 

• Condiciones de resolución del contrato de 
investigación. 

• Cláusulas de penalización por falta de adecuación a lo 
pactado, como retrasos en la entrega del trabajo, etc. 



Capítulo 2 

Fuentes de información (I). 
Fuentes cualitativas 

2.1. Introducción. Ob j etivos del capítulo. 

2.2. Fuentes de información. Concepto , características v clases. 

2.3. Características de las fuentes de información e investi g ación de 
mercado. 

2.4. Fuentes cualitativas de obtención de información. 

FUENTES DE INFORMACIÓN (I). 
FUENTES CUALITATIVAS 

2.1. INTRODUCCIÓN. OBJETIVOS DEL 
CAPÍTULO 

A lo largo de este capítulo se exponen, esencialmente, una serie de 
conceptos relacionados con las fuentes de información para la 
investigación exploratoria. Una vez examinado el lector conocerá, 

• Qué son fuentes de información. 

• Cómo se clasifican las fuentes de información. 

• Qué son fuentes cualitativas. 

• Cuál es la utilidad de las fuentes cualitativas. 

• Qué dimensiones tienen la fuentes de información. 

• Qué es la creatividad. 













• Qué es la dinámica de grupos. 

• Qué es la observación. 

• Qué es la pseudocompra. 

• Qué son técnicas proyectivas. 

• Qué limitaciones tienen las fuentes cualitativas. 


2.2. FUENTES DE INFORMACIÓN. 
CONCEPTO, CARACTERÍSTICAS Y CLASES 

La información se puede definir como el conjunto de fuentes de 
conocimientos necesarios para comprender situaciones, tomar 
decisiones o evaluar las ya tomadas. En el capítulo anterior se han 
expuesto conceptos que mezclan diferentes tipos de fuentes de 
información con diversas investigaciones. Un buen investigador deber 
tener muy claros los objetivos de una investigación, debe saber qué 
información debe reunir, dónde encontrarla y cómo tiene que tratarla. 

Es muy importante saber en qué consiste cada una de las fuentes de 
información, porque su utilidad y aplicación no es la misma en las 
investigaciones. Por ejemplo, no se pueden aplicar técnicas 
proyectivas para hacer una segmentación de mercados, ni las 
encuestas son válidas cuando se trata de evaluar el interés que 
muestran los bebés por un juguete nuevo. 

2.2.1. Fuentes de información según su naturaleza 

A continuación se definen de forma sucinta las técnicas de recogida 
de información que se emplean con mayor frecuencia. Más adelante se 
desarrollarán con detenimiento a lo largo de este capítulo y del 
siguiente. 

La relación más inmediata para diferenciar las fuentes de información 
es la que se fija en sus características básicas, en su naturaleza, en 
qué consisten. Así, se pueden encontrar las siguientes fuentes. 


Fuentes bibliográficas e Internet. Muchas investigaciones se 
pueden llevar a cabo a partir de información que aparece publicada 



en libros o se que puede descargar de Internet. Los anuarios, las 
estadísticas oficiales de los países, informes económicos editados por 
instituciones financieras, libros sobre comportamiento de los 
consumidores, de tendencias observadas, etc. y muchas páginas web 
son fuentes de información excelentes para comprender muchas 
situaciones que invitan a desarrollar investigaciones. 

Observación. A veces no es posible recoger información 
proporcionada directa y voluntariamente por las personas. Entonces 
se presta atención a cómo se comportan. Por ejemplo, se puede 
observar el comportamiento de unos bebés en una guardería ante un 
juguete nuevo, o cómo eligen los compradores la marca de leche que 
adquieren en un supermercado. 

Pseudocompra. Esta técnica consiste en que el investigador actúa 
como un cliente y observa el comportamiento del vendedor, con 
objeto de valorar sus conocimientos, actitudes hacia las marcas que 
vende, sus preferencias, capacitación, competencia y calidad del 
servicio prestado. Por ejemplo, los evaluadores de las guías Michelín o 
CAMPSA actúan en estos términos. 

Técnicas de creatividad. Consisten en reuniones de personas en las 
que el grupo que participa propone espontáneamente soluciones a 
problemas o ideas para desarrollar productos nuevos, o para 
mejorarlos, o para encontrar causas de problemas y buscar posibles 
soluciones. Por ejemplo, un grupo de empleados de una empresa 
puede aportar ideas sobre cómo podrían reducirse los costes, o sobre 
qué atributos podría tener un televisor para diferenciarlo del resto de 
la competencia. 

Dinámica de grupos. También llamada grupo de discusión, esta 
técnica consiste en que un conjunto de personas debate y opina sobre 
un tema prefijado de antemano, bajo la dirección de un moderador. 

Por ejemplo, un conjunto de amas de casa debate sobre la utilidad de 
un horno de microondas. 

Entrevistas. Son encuentros con personas para recoger información 
relativa a sus comportamientos, opiniones y actitudes. Por ejemplo, se 
puede entrevistar a un investigador para que dé su opinión sobre el 
desarrollo tecnológico en un futuro próximo, o a un sociólogo para que 
explique el aumento de la violencia infantil. 



Técnicas proyectivas. Son instrumentos que descubren aspectos 
inconscientes de las personas a través de asociaciones de palabras, o 
posibles explicaciones de conductas o hechos. Por ejemplo, se podría 
pedir a una persona que dijera si la marca de coches Ford fuera un 
animal, qué sería, un pez o un pájaro. Un analista especializado en 
este tipo de técnicas podría valorar la imagen que tiene esa persona 
de esta marca de vehículo, de acuerdo con el significado simbólico de 
los animales en nuestra cultura occidental. 

Bases de datos. Son conjuntos de informaciones relacionadas y 
accesibles conforme a algún criterio. Por ejemplo, la relación de 
clientes de El Corte Inglés o los directorios de empresas que diseñan 
las Cámaras de Comercio son ejemplos de bases de datos. 

Paneles. Son muestras estables de consumidores o de 
establecimientos comerciales que proporcionan información periódica 
sobre sus actos de consumo y hábitos de exposición a medios de 
comunicación. Tratándose de establecimientos comerciales la 
información se refiere al comportamiento de las ventas, existencias, 
promociones, etc. 

Encuestas. Consisten en un conjunto articulado y coherente de 
preguntas que se formulan a las personas sobre la base de un 
cuestionario. Se puede realizar por correo, frente a frente, en la calle, 
en establecimientos comerciales o en el domicilio de las personas, y 
también a través del teléfono. 

Estas fuentes de información son muy diferentes entre sí, y su 
capacidad para proporcionar conocimiento para llevar a cabo 
investigaciones es muy dispar. Estas fuentes se pueden clasificar 
atendiendo a criterios muy diversos. A continuación se muestran esos 
criterios de clasificación y en el cuadro 2.1 (pág. 66), de forma 
sintética, las características que poseen las fuentes de información. 

2.2.2. Fuentes de información según su 
disponibilidad: información primaria y secundaria 

La información puede ya existir cuando surge su necesidad para 
realizar una investigación o, por el contrario, debe ser creada para 
cumplir este cometido. En función de su disponibilidad se habla, 
respectivamente, de información secundaria y primaria. 



La información primaria es la que el investigador crea 

expresamente para un estudio concreto. Esta información no existe en 
el momento en que se plantea la necesidad de utilizarla. Las 
organizaciones deben, entonces, acudir a investigaciones ex profeso 
para obtenerla, empleando para ello diversas técnicas, como la 
observación, la pseudocompra, las reuniones de grupo o los métodos 
experimentales. Otras veces se obtiene la información mediante 
diversos tipos de encuestas, que posteriormente serán tratadas con 
las herramientas estadísticas adecuadas. 

Sin embargo, es poco probable que las necesidades de información 
sean tan especiales o únicas que no exista previamente ningún tipo 
de datos o estudios relacionados con la investigación que se desee 
realizar. Con mucha frecuencia los investigadores encuentran datos, 
informes, páginas web o metodologías que les resultan sumamente 
útiles para sacar adelante sus proyectos. Esta información que ya 
existe, que se encuentra disponible en el momento en que surge la 
necesidad de su utilización, recibe el nombre de información 
secundaria. 

La información secundaria puede haber sido creada en el pasado por 
los investigadores o puede haber sido generada por terceros ajenos a 
ellos. En estos casos se habla, respectivamente, de información 
secundaria interna o externa. 

La importancia de la información secundaria, al margen de cuál sea 
su soporte, resulta evidente, por las siguientes razones. 

• Un investigador no debería buscar una información si otros ya lo 
han hecho antes por él. 

• La información secundaria ahorra mucho tiempo y esfuerzos 

de todo tipo en el desarrollo de las investigaciones. 

• El coste de obtener información secundaria es inferior al de 

obtener información primaria. 

• Muchas veces proporciona al investigador la única información 
que puede emplear, pues éste por sus propios medios sería incapaz de 
recoger todo el cúmulo de datos que precisa para alcanzar sus 
objetivos. 



La utilidad de la información secundaria ya se ha justificado, pero aún 
se pueden proporcionar argumentos adicionales para su empleo, que 
se pueden clasificar razones económicas, metodológicas y derivadas 
de las características del entorno o de las propias organizaciones. 


Razones económicas 

La información secundaria, en general, 

• Se obtiene más rápidamente que la primaria. 

• El proceso de su obtención es sencillo. 

• Generalmente, tiene un coste monetario de adquisición más 
reducido que la primaria. 

• Su obtención requiere mucho menos esfuerzos en general. 

Razones metodológicas 

Cuando los investigadores inician sus proyectos suelen acudir a 
información secundaria porque, 

• El examen de la información ayuda a identificar problemas o 
aproximarse mejor a ellos. 

• La valoración de la información secundaria ayuda a definir mejor 
los problemas y a concretarlos. 

• La formulación del diseño de las investigaciones mejora, 
porque se tiene un mayor conocimiento de los avances hechos hasta 
el momento. 

• Se puede valorar la factibilidad de desarrollar las 
investigaciones tras enjuiciar investigaciones previas, o juzgar la 
calidad de los datos existentes para poder acometerlas. 

• El investigador puede formular hipótesis explicativas de 

hechos o fenómenos tras el análisis de información secundaria 
relacionada con ellos. 



• Se pueden encontrar secuencias temporales de datos para 
contrastar hipótesis previamente formuladas. 

Características del entorno 

Existen, además, motivos derivados de las características y 
complejidad del medio en el que se desenvuelven las actividades de 
las organizaciones. 

• Las empresas se encuentran con unos entornos legal, 
demográfico, cultural, político, económico, tecnológico, etc. cada vez 
más complejos de analizar y existen terceros pueden hacerlo o ya 
lo han hecho por ellas. 

• Las empresas actúan en mercados cada vez más amplios y 
difíciles de conocer en lo que respecta a la información económica; 
los valores y características de los consumidores culturalmente 
distantes; las características físicas de los consumidores por territorios 
geográficos; los hábitos sociales en esos territorios, etc. 

• Las investigaciones de mercado no son suficientes, porque la 
información necesaria para la gestión de las organizaciones suele ser 
multidisciplinar (financiera, comercial, técnica, etc.) y compleja, y no 
sólo hace falta la relativa al ámbito comercial. 

• Los mercados son cada vez más heterogéneos y los 

consumidores, más difíciles de conocer. 

• El desarrollo de tecnologías informáticas facilita 
progresivamente el desarrollo de sistemas de almacenaje de 
información y de su recuperación para su tratamieto o análisis. 

Los investigadores deben seguir el proceso que aparece en el g ráfico 
2.1 para optar entre información primaria y secundaria. 

Gráfico 2.1. 

Selección de fuentes de información 
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2.2.3. Fuentes de información por la posibilidad de 
tratamiento cuantitativo 




La propia naturaleza de la información condiciona las posibilidades de 
tratamiento estadístico. En principio, se puede proponer que 
solamente la información que proporcionan las encuestas, las bases de 
datos y los paneles es susceptible de tratamiento cuantitativo, con la 
ayuda de técnicas matemáticas y estadísticas. 

Por el contrario, la información que se puede obtener a través de 
grupos de discusión, pseudocompra, observación, técnicas de 
creatividad o proyectivas o entrevistas no es posible tratarla en la 
inmensa mayoría de los casos con la ayuda de técnicas estadísticas o 
matemáticas; será interpretada según los conocimientos y criterios de 
los analistas. 

Las fuentes de información que proporcionan datos que se pueden 
tratar con técnicas estadísticas o matemáticas reciben el nombre de 
fuentes de información cuantitativas o, simplemente, técnicas 
cuantitativas. En caso contrario se denominan técnicas cualitativas. 

2.2.4. Fuentes de información según su grado de 
dinamismo: fuentes estáticas y dinámicas 

Existen fuentes de información que la proporcionan una sola vez en el 
tiempo y otras la suministran de forma periódica y continuada. En 
consecuencia, existen fuentes de información estáticas y 
dinámicas. Para realizar determinadas investigaciones sólo es 
necesario obtener información en un momento del tiempo; por 
ejemplo, para conocer la intención de voto antes unas elecciones. 
Otras veces conviene obtener información en diferentes momentos de 
tiempo, para hacer comparaciones; por ejemplo, cómo evoluciona la 
cuota de mercado de un yogur nuevo que acaba de salir al mercado. 

En este caso se emplea un panel de consumidores, que proporciona 
información mensual sobre el comportamiento observado. Algunas 
técnicas son por su naturaleza estáticas y otras dinámicas, como se 
puede observar en el cuadro 2.1 (pág. 66), y se profundizará a lo largo 
de este capítulo. 

2.2.5. Fuentes de información según grado de 
contacto con las personas que proporcionan la 
información: fuentes personales e impersonales 



Algunas técnicas de recogida de información suponen mucho contacto 
con las personas; por ejemplo, las entrevistas personales, las 
dinámicas de grupo, las encuestas a domicilio o las técnicas 
proyectivas. Otras veces el contacto es nulo, como ocurre con las 
encuestas por correo, la observación o cuando se emplean bases de 
datos. Atendiendo al grado de contacto con las personas las técnicas 
se pueden clasificaren personales e impersonales. 

2.2.6. Fuentes de información según el grado de 
colaboración mostrado por las personas que la 
proporcionan: fuentes directas e indirectas 

Las personas que colaboran en las investigaciones pueden ser 
plenamente conscientes de la información que proporcionan, de su 
utilidad y previsible uso. Esto ocurre, por ejemplo, cuando se 
manifiestan intenciones de voto a un encuestador. Otras veces las 
personas que colaboran saben que proporcionan información, pero no 
llegan a saber exactamente qué se hará con ella, no intuyen su 
utilidad. Esto ocurre, por ejemplo, cuando a una persona se le pide 
que relacione marcas de coches con animales. Cuando las personas 
conocen o intuyen la utilidad de la información que aportan se habla 
de técnicas directas. Cuando ello no es posible se trata de técnicas 
indirectas. 

2.2.7. Fuentes de información por su función en el 
proceso de investigación 

Probablemente, el criterio más adecuado que en teoría podría 
encontrarse para clasificar las fuentes de información sea el relativo a 
la función que desempeñan para llevar a cabo las investigaciones. En 
este sentido cabe proponer lo siguiente. 

Las investigaciones exploratorias suelen realizarse cuando no se 
tienen muchos conocimientos previos sobre la realidad que se va a 
investigar. En estos casos se suele acudir a obtener información 
secundaria que sirva para centrarse sobre aquélla. En este sentido son 
muy útiles las dinámicas de grupo, la observación o las técnicas 
proyectivas, las consultas bibliográficas o la compra y explotación de 
bases de datos. 



No puede defenderse que las investigaciones exploratorias deban 
desarrollarse siempre con fuentes de información secundaria, por 
ejemplo, a partir de información de una base de datos. Se puede 
acudir a una dinámica de grupos, que es una técnica de recogida de 
información primaria y, además, cualitativa. Una base de datos puede 
ser información primaria para quien la compra, pero las empresas que 
las crean para su uso la tienen que considerar como información 
secundaria interna. Esa misma base de datos puede servir a unas 
empresas para hacer investigaciones descriptivas y otras la podría 
comprar para hacer investigaciones exploratorias. 

No hay que obsesionarse con el intento de clasificar o encasillar las 
fuentes de información aplicando un criterio u otro. Lo que debe 
hacerse es conocer bien las fuentes, sus características y su utilidad, y 
saber cuándo deben ser aplicadas. 

La tabla 2.1 muestra las características que se han mencionado en 
este apartado para un conjunto de fuentes de información 
considerando su naturaleza. 
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2.3. CARACTERÍSTICAS DE LAS FUENTES 
DE INFORMACIÓN E INVESTIGACIÓN DE 
MERCADOS 

La elección de la fuente de información para realizar una investigación 
es una tarea compleja. Un mismo problema puede requerir el uso de 
fuentes diversas. El investigador debe tener muy claro el objetivo de 
la investigación. Por ejemplo, ante una reducción de las ventas de 
vinos y licores se puede pensar en la conveniencia difundir una 
encuesta entre los consumidores para conocer los motivos. También se 
podría pensar en estudiar la evolución del precio, o la legislación en 
materia de venta de alcohol a menores, los horarios de apertura de los 
bares o la evolución de los impuestos que gravan su consumo. 

Para conocer los motivos por los cuales los consumidores prefieren 
pilas recargables a las desechables una vez agotadas podría 
difundirse una encuesta en la población. La obtención de información 
a través de una encuesta y su posterior análisis resultan caros. Tal vez 
las causas del problema que se desee conocer se puedan identificar 


estudiando solamente aspectos cualitativos. En este caso la 
explicación podría ser una mayor sensibilidad sobre la conservación 
medioambiental. También es posible que los aspectos cualitativos que 
puedan identificarse deban ser contrastados con un análisis empírico 
posterior. 

Un principio básico de investigación es que cualquier estudio debe 
comenzar por una fase cualitativa, que permita aproximarse al 
problema y conocerlo. En caso de que ya sea conocido, la fase 
cualitativa ayudará, sin duda, a definirlo aún con más precisión y 
desarrollarlo en mejores condiciones. Una vez realizada la fase 
cualitativa se puede proceder, si fuera necesaria, a una fase 
cuantitativa, en la que se analizarán datos, generalmente primarios, 
con técnicas estadísticas y matemáticas. Muy frecuentemente, los 
estudios cuantitativos refrendan las conclusiones a las que se llega 
tras realizar estudios cualitativos. 

En resumen, para decidir qué fuentes de información deben 
emplearse hay que tener en cuenta que, 

• Si la investigación es exploratoria debe comenzarse con el 
análisis de fuentes cualitativas o secundarias. 

• Cuando se trate de investigaciones descriptivas también debe 
realizarse una fase cualitativa, para centrar bien los objetivos y 
diseñar la investigación. Posteriormente se desarrollará la fase 
cuantitativa. 


2.4. FUENTES CUALITATIVAS DE 
OBTENCIÓN DE INFORMACIÓN 

Los datos cualitativos consisten en «descripciones de situaciones, 
sucesos, personas, interacciones y conductas observadas; reiatos 
directos de experiencias personaies, actitudes, creencias y 
pensamientos; pasajes compietos de documentos, correspondencia, 
informes y casos históricos». 


Las fuentes cualitativas tienen, globalmente, las siguientes 
características. Son, 



• Primarias; se aplican para desarrollar investigaciones cuando 
surge su necesidad. Esta afirmación debe matizarse, pues la 
bibliografía o páginas WEB son secundarias. En general, no obstante, 
se puede proponer que las fuentes cualitativas son globalmente 
primarias. 

• Estáticas; se emplean para obtener información adecuada a los 
objetivos concretos de una investigación en un momento del tiempo. 
Generalmente, los resultados que se obtienen no suelen tener una 
validez permanente. 

• Personales; requieren la presencia o colaboración de personas 
para poder ser aplicadas. 

• Adecuadas para investigaciones exploratorias; permiten 
aproximarse a problemas y comprenderlos, pero los resultados no 
suelen ser extrapoladles porque se emplean muestras pequeñas y 
poco representativas. 

• Por ser cualitativas son contadas las excepciones en las que es 
posible un tratamiento de datos que requiera la utilización de 
técnicas estadísticas. Excepcionalmente se emplean técnicas 
estadísticas no paramétricas. 

• Se emplean en las primeras fases del diseño de un estudio, y 
sirven, sobre todo, para generar hipótesis que podrán ser verificadas 
en un posterior estudio cuantitativo. 

Un elemento diferenciador importante de las diversas fuentes 
cualitativas radica en la clase de colaboración que proporcionan las 
personas. Pueden identificarse dos grupos de técnicas. El primero lo 
constituyen las que requieren la colaboración activa de las 
personas, y lo forman las técnicas de creatividad, las dinámicas de 
grupos y las entrevistas. El segundo grupo lo forman técnicas en las 
que las personas proporcionan información sin ser conscientes de 
ello. Lo constituyen la observación, la pseudocompra y las técnicas 
proyectivas de asociación, complementación, expresión y 
construcción. 
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Gráfico 2.1 


Las investigaciones deben comenzar, por principio, con la recogida de 
información cualitativa, empleando para ello técnicas o fuentes 
específicas. Las fuentes cualitativas resultan imprescindibles para, 

• Desarrollar investigaciones de naturaleza exploratoria, como 
obtener información previa sobre un determinado campo del que no 
se tiene ningún conocimiento, para que el investigador se familiarice 
con él. 

• Desarrollar investigaciones explicativas a partir de actitudes, 
motivaciones o creencias. Una cadena de hipermercados podría 
encontrar que se incrementan las ventas de aceite de oliva y 
disminuyen las de mantequilla. Una investigación cualitativa podría 
poner de relieve que la población se encuentra preocupada la relación 
que existe entre el consumo de grasas y aceites y la salud 
cardiovascular. 

• Evaluar actividades de marketing, como el diseño de 
productos, su percepción, la fijación de precios, el diseño de los 
envases o de anuncios publicitarios. En una investigación cualitativa 
se puede percibir que un precio es caro, que un producto posee 
atributos no valorados, que un envase es poco funcional o que un 
anuncio resulta desagradable, o no se entiende. 

• Conocer la terminología de los consumidores, y en general, 
su comportamiento. Antes de confeccionar un cuestionario debería 
llevarse a cabo un estudio cualitativo para conocer el lenguaje del 
público al que se dirige, y proceder a una redacción asequible y 
adecuada, para su correcta comprensión. No es lo mismo dirigirse a 
personas cultas que de escasa cultura, mayores o niños. Cada 
población tiene un lenguaje propio, que debe ser respetado y recogido 
en el cuestionario. 

2.4.1. Fuentes bibliográficas e internet 

La red Internet fue creada en Estados Unidos durante los años sesenta 
para conectar los ordenadores que controlaban la defensa del país. En 
caso de fallo en alguno de ellos los demás seguirían actuando y 
podrían repeler un hipotético ataque. 

Para buscar información en la red se utilizan motores de búsqueda, 
comúnmente llamados navegadores. Las posibilidades de encontrar 



cualquier información en Internet son muy altas. Prácticamente en la 
red existe de todo. Resultaría muy pretencioso y seguramente inútil 
tratar de presentar una colección exhaustiva de direcciones en 
Internet. Constantemente se está actualizando y mejorando. 

Además, las búsquedas se realizan todas de la misma forma. Se carga 
el motor de búsqueda o navegador, se teclea la dirección que se desea 
consultar y se siguen las instrucciones que aparecen en pantalla. 

Basta con «pinchar» las letras, rótulos o iconos que aparecen en la 
pantalla. 

La lista de páginas de Internet es muy extensa, y está constantemente 
ampliándose. A continuación se muestran algunas que resultan 
interesantes. No obstante, el lector puede consultar bibliografía 
específica sobre direcciones en Internet. 

Cuadro 2.2. Algunas direcciones en Internet 


Materia 

Dirección 

Contenido 

Biblioteca 


www.bne.es 

Nacional de 
España 

Bibliotecas del 
Centro Superior 


www.csic./cbic/cbic.htm 

de 

Investigaciones 

Bibliotecas 

www.rutaazul.com/biblios/ 

Científicas 

Red de 

bibliotecas 

mundial 


www.bl.uk/ 

Biblioteca 

británica 

Enlace con las 


www.lib.washinoton/edu/sla/natlib.html 

mejores 

bibliotecas 

Organismos 


Instituto de 

en España 

www.icex.es 

Comercio 

Exterior 

Ministerio 


www.mec.es 

Educación y 
Ciencia 










www.ine.es 


www.nnaD.es/ 


www.csic.es/ 


www.toursDain.es/ 


www.min.es/ 


www.oeDm.es/ 


www.consumo-inc.es/ 


www.cis.es 


www.aedemo.es 


Empresas 

relacionadas 

con la www.nielsen.com 

investigación 

de mercados 


www.kantarworldDanel.com 


www.aimc.es 


Instituto 
Nacional de 
Estadística 
Ministerio de 
Administraciones 
Públicas 
Centro Superior 
de 

Investigaciones 
Científicas 
Instituto de 
Turismo de 
España 
Ministerio de 
Industria y 
Energía 

Oficina de 
patentes y 
marcas 
Instituto 
Nacional de 
consumo 
Centro de 
Investigaciones 
Sociológicas 
Asociación 
Española de 
Estudios de 
Mercado y 
Opinión 
Nielsen 
Company. 

Paneles de 
Detallistas 
Instituto Taylor 
Nelson Sofres 
Dympanel 
Estudio General 
de Medios 


















Directorios Eurooa.eu.int/ 


www.infononnics.net 


donde.u i i.es/ 


www.euro Daa es.com 

c vber a uia.com/ 

emDresas.seric.es/ 


www.moebius.es/inter a uia/ 


Información 
completa de la 
Unión Europea 
(excelente) 
Acceso a 
estadísticas y 
bases de datos 
europeas 
Fuentes de 
información 
económica en 
España 
Enlaces a 
páginas oficiales, 
empresas 
Datos de 
empresas 
europeas 
Empresas y 
servicios en 
España 

50.000 empresas 

clasificadas en 

España 

Guía de 

empresas, 

comercios y 

productores 


Fuente: Elaboración propia. 

2.4.2. Las técnicas de creatividad 

Constituyen un conjunto de técnicas de obtención de información 
cualitativa, primaria, directa, estática y personal, que consisten en 
que un grupo de personas proporciona ideas orientadas, muy 
frecuentemente, a la creación de productos nuevos o a la solución de 
problemas que diversa índole que pudieran aparecer en las 
organizaciones. Suele aplicarse en investigaciones de naturaleza 
exploratoria. La creatividad puede ser. 















• Intuitiva, basada en las argumentaciones obtenidas tras un 
proceso no demasiado formal, de un conjunto de personas. Por 
ejemplo, el brainstorming, o generación masiva de ideas u opiniones 
que se realiza ante un colectivo en la que participan 
espontáneamente todos sus miembros. 

• Formal, basado en juicios razonados que justifiquen las ideas que 
se proponen. Por ejemplo, se puede pedir que se den ideas para el 
diseño aparato de televisión, y que se defiendan razonadamente los 
nuevos atributos que se proponen. 

Las técnicas de creatividad requieren la colaboración de un colectivo 
de personas. Existen algunos problemas en su aplicación, 
especialmente con el brainstorming. La creatividad se basa en que las 
personas opinan y manifiestan sus juicios libremente. Si en un mismo 
grupo se encuentran personas de distintos niveles de la estructura 
organizativa, generalmente las integradas en los inferiores casi nunca 
contradicen a quienes son sus superiores en el organigrama, y tienden 
a manifestar un comportamiento retraído en las reuniones. Más que 
una limitación de la técnica es un problema que debe evitarse, y para 
ello sería una buena política formar grupos homogéneos desde el 
punto de vista jerárquico. 

Las técnicas de creatividad son muy útiles para recoger información 
relativa a ideas sobre productos nuevos, proponer mejoras en los 
existentes, encontrar denominaciones de marca, y en general, para 
identificar problemas en las organizaciones y proponer soluciones. 

2.4.3. La dinámica de grupos 

2.4.3.1. Concepto 

Es una técnica de recogida de información cualitativa, primaria, 
estática, personal y directa, que suele aplicarse en investigaciones de 
naturaleza exploratoria. Consiste en la reunión de grupos de personas, 
bajo la presencia de un moderador, que conversan entre ellas y con él, 
sobre un tema previamente definido, con objeto de encontrar una 
solución a un problema o de proporcionar información sobre aquél, 
sugerir un producto o servicio, encontrar causas de ciertos fenómenos, 
etc. Por ejemplo, se puede organizar una dinámica de grupos para 
encontrar soluciones a los atascos del tráfico en las ciudades o para 



juzgar la utilidad de un prototipo de aspiradora que destruya los 
ácaros. 

Para conseguir dinámicas que resulten de utilidad debe tenerse en 
cuenta lo siguiente. 

• Previamente han tenido que haber sido definidos los objetivos a 
alcanzaren la investigación y que sean conocidos por todos los 
integrantes del grupo. 

• Este debe ser homogéneo y adecuado, porque posea 
conocimientos y experiencia para proporcionar información útil para la 
determinación de los objetivos de la investigación. 

• El grupo debe tener una dimensión adecuada, normalmente 
siete personas, que permita la conversación entre sus integrantes. 

• El grupo debe ser fácilmente controlable por el moderador o 
director de la reunión. 

Las reuniones de grupo se pueden grabar en cinta de audio o vídeo. La 
interpretación se hace basándose en lo que se dice, cómo se dice, qué 
actitudes se adoptan, la rapidez de las respuestas, etc. 

2.4.J.2. Utilidad 

La dinámica de grupos resulta muy interesante en investigaciones 
exploratorias en marketing para, 

• Conocer el léxico de los grupos para conseguir comunicaciones 
eficaces o para preparar cuestionarios comprensibles. 

• Aproximarse a los problemas o familiarizarse con ellos. Por 
ejemplo, comprender por qué la gente no quiere consumir azúcar, por 
qué se rechazan las pilas con mercurio o por qué tiene cada vez mayor 
demanda el turismo rural. 

• Generar ideas de nuevos productos. Un empresario podría 
utilizar grupos para que fueran los consumidores quienes le sugirieran 
nuevos productos. En un grupo se podría considerar la posibilidad de 
fabricar parabrisas de coches que se oscurecieran con la luz, como 
algunos cristales de gafas, idea que debería contrastarse con una 
investigación descriptiva. 



• Desarrollar test de concepto, es decir, conocer qué creen los 
consumidores que es un producto o cómo conciben sus atributos. Por 
ejemplo, se podría preguntar que entiende el mercado por aceite 
sintético o bronce sinterizado. Las empresas pueden contrastar la 
realidad de sus bienes o servicios actuales, e incluso sus proyectos, 
con las concepciones de los consumidores. El contraste es muy útil 
para diseñar estrategias de diseño, precio o comunicación. 

• Identificar atributos de los productos. Los consumidores 
pueden proporcionar a los fabricantes ideas sobre el uso de los 
productos o sobre sus atributos. Por ejemplo; los productores de 
suavizantes para la ropa crearon un producto para combatir la dureza 
del agua. Sin embargo, el mercado percibió sobre todo buen olor en la 
ropa. Tras los análisis cualitativos, los fabricantes de suavizantes 
comunicaron a través de la publicidad que su producto, además de 
ropa más suave, dejaba un aroma agradable. 

• Evaluar la conveniencia de hacer test de mercado. Cuando 
las empresas ya han creado sus productos suelen realizar pruebas de 
mercado, es decir, seleccionan áreas geográficas limitadas, donde se 
ensayan precios, canales de distribución y de comunicación. Estas 
pruebas son caras y llevan tiempo. Sin embargo, la dinámica de 
grupos puede servir para clarificar el precio que los consumidores 
están dispuestos a pagar, cómo debería diseñarse la comunicación y 
qué tipo de establecimientos consideran más convenientes para 
comprar el producto antes de decidir realizar un test de mercado. 

• Hacer previsiones del éxito de nuevos productos. En un grupo se 
puede detectar el interés que suscite un producto o servicio. En las 
reuniones se podría detectar la utilidad prevista, sus ventajas, 
inconvenientes, frenos a la utilización, etc. Por ejemplo, un grupo 
podría opinar lo acertado y la probable aceptación del diseño de un 
tejido que repeliera las manchas. 

• Conocer las causas de una disminución de las ventas. Una 

empresa podría ser testigo de la disminución de las ventas de alguno 
de sus productos, por ejemplo, un exprimidor de cítricos. Esta 
situación podría resultar incomprensible, dados los esfuerzos de los 
vendedores, el precio competitivo, la calidad del producto o las 
actividades de promoción. Un grupo de discusión podría poner de 
relieve que el exprimidor gotea, y mancha la encimera de la cocina. 



mientras que los de la competencia llevan una tapa que impide el 
goteo. 

• Conocer el uso que se hace de los productos. Un fabricante de 
alimentos podría detectar, a través de grupos de discusión, que su 
chocolate soluble lo consumen personas de la tercera edad para 
merendar, en lugar de niños para desayunar. Esta circunstancia 
permitiría orientar mejor las actividades de mix, e incluso ofrecer 
algún producto complementario del cacao, como pastas o bizcochos, 
pensando en la merienda de los adultos. 

• Evaluar la competitividad de los productos, basada en la 
percepción de calidad de los componentes o prestaciones. La mayoría 
de los compradores de máquinas de fotos no aprecia diferencias entre 
la construcción de un cuerpo de cámara hecho de resina inyectada - 
un tipo de plástico- o aluminio, mucho más duradero y resistente, y 
también mucho más caro. Los fabricantes tienen las ideas muy claras: 
sólo se ofrecen cuerpos metálicos cuando se trata de equipos 
profesionales o caros. Es más, los consumidores, a igualdad de precio, 
tampoco se decantan por el aluminio. 

• Evaluar envases. Un grupo de consumidores puede enjuiciar el 
diseño de un prototipo de envase; su estética, sus atributos 
funcionales, su tamaño, la comodidad para ser transportado y 
almacenado y la capacidad para conservar el producto. 

• Evaluar precios. Para fijar precios las empresas no emplean 
ecuaciones ni calculan derivadas parciales. Diversos grupos de 
personas aportan información sobre los atributos percibidos y cuánto 
están dispuestas a pagar por ellos. Por adición se llega calcular un 
precio de mercado razonable y que puede ser aceptado por los 
consumidores. 

• Pretest publicitario antes de una campaña de comunicación. Las 
campañas publicitarias son muy caras. Antes de lanzar un anuncio a 
los medios un grupo de personas podría, tras ser visto, opinar sobre su 
poder de comunicación, credibilidad, aspectos estéticos, etc. 

2.4.3.3. El diseño de las sesiones de grupo 

El moderador. Generalmente se acude a sociólogos o sicólogos, 
buenos conocedores de las técnicas de grupo. Algunas normas útiles 



para que el moderador actúe con éxito son las siguientes. 


• El moderador debe ser aceptado por el grupo, debe «caer bien» a 
las personas. 

• Debe ser sensible a las nuevas ideas que surjan del grupo y que 
no hayan sido tenidas en cuenta en el guión inicial de objetivos de 
información a recoger. 

• Debe tener buena memoria para los nombres. Se ha comprobado 
que los asistentes a las sesiones colaboran mejor si se les llama por su 
nombre. 

• Debe ser neutral, tanto en el planteamiento de los objetivos de la 
investigación como en la solución de los conflictos o discusiones que 
pudieran surgir durante el desarrollo de la sesión. 

• Debe saber mantener la conversación del grupo y evitar que se 
desvíe por otros derroteros. 

Características del grupo 

• Debe estar incentivado desde un punto los puntos de vista 
económico y emocional. Las personas que participan en una dinámica 
de grupos reciben una compensación económica por el tiempo que 
dedican, que generalmente se materializa en un cheque regalo para 
ser utilizado en algún establecimiento comercial. La incentivación 
emocional hace referencia al estímulo que se debe realizarse para 
conseguir la colaboración de las personas, en el ánimo que hay 
proporcionarles. 

• No debe ser muy numeroso, por dos razones. La primera es que 
en caso contrario no es controlable. La segunda es que en un grupo 
numeroso algunas personas quedan diluidas por las demás. 
Generalmente, los grupos los integran siete personas para que no se 
formen grupos o bandos de aliados de igual tamaño. 

• Los componentes de un grupo deben tener conocimientos y 
experiencia sobre la materia que se va a estudiar, para que puedan 
hablar con propiedad, y que sus opiniones sean dignas de 
consideración. 



• Debe evitarse la formación de conflictos en el grupo. Estos 
conflictos pueden provenir de distintas concepciones, ideologías, 
género o edad. Una buena norma, en general, es formar grupos 
homogéneos en sus características básicas. 

2.4.3.4. Valoración de la dinámica de grupos 

Las reuniones de grupo han demostrado ser una técnica de recogida 
de información muy útil. A continuación se exponen algunas 
características, positivas y negativas. 

Los aspectos positivos son, 

• Rapidez. Las sesiones de grupo duran dos o tres horas. En pocos 
días se pueden realizar varias y analizar los resultados. Quizá el único 
problema podría residir en localizar el grupo. Las empresas o los 
institutos de estudios de mercado tienen localizados grupos para 
desarrollar dinámicas con ellos. 

• Flexibilidad. Algunas técnicas de investigación comercial son 
complicadas, formales y rigurosas. Por el contrario, la dinámica de 
grupos es una técnica muy simple, en que lo más importante es actuar 
con sentido común. Para su desarrollo no existen normas muy rígidas, 
y el moderador puede emplear su imaginación para desarrollar las 
sesiones de la forma que considere más oportuna. 

• Empatia. El moderador hábil, con don de gentes, puede reducir la 
distancia y favorecer la comunicación entre los miembros del grupo, 
cuya composición puede ser heterogénea, o aproximar a personas que 
inicialmente no se conocen. 

• Dinamismo. La dinámica de grupos tiene una serie de efectos 
positivos. Uno de ellos es la sinergia. El grupo produce más ideas en 
conjunto que las personas por separado. El grupo no suma, sino que 
multiplica las ideas individuales. También se produce un efecto bola 
de nieve; es decir, las ideas o comentarios de unas personas inspiran 
a otras. Se producen encadenamientos de ideas. Si el moderador es 
hábil, los participantes se sentirán cómodos y darán información 
espontánea y de calidad. 

Entre los aspectos negativos de la dinámica de grupos se pueden 
citar. 



• Subjetivismo. La dinámica de grupos no está exenta del peligro 
que supone el subjetivismo de la interpretación de las opiniones 
dadas por las personas que participan. No existen libros ni manuales 
que enseñen a interpretar como una tarea mecánica. 

• Artificialidad. La dinámica de grupos es una investigación 
«orquestada», quizá poco natural. Es posible que una persona no 
manifieste sus opiniones propias, sino las que se espera de su 
condición, o no se atreva a contradecir al resto de un grupo que opina 
en sentido contrario a ella. También es posible que por razones de 
timidez se reserve opiniones muy valiosas. 

• Parcialidad. El moderador u otra persona puede cautivar a algún 
asistente y hacerle responder, involuntariamente, en un sentido no 
esperado de él en otras condiciones. Incluso es posible que sea el 
moderador quien se vea influenciado por algún asistente a la sesión. 

2.4.4. La entrevista 

2.4.4.1. Concepto y clases 

Es una técnica cualitativa, primaria, estática, personal y directa que 
suele aplicarse en investigaciones de naturaleza exploratoria. Una 
entrevista no es más que una conversación entre dos personas, 
frente a frente, para intercambiar información, ideas, opiniones o 
sentimientos. La entrevista, como técnica cualitativa de información, 
persigue unos propósitos bien definidos; es más que una simple 
conversación. Puede ser varias clases, en función de la rigidez con se 
siga el guión que la conduce. 

• La entrevista estructurada se caracteriza porque el 
entrevistador realiza exclusivamente las preguntas que figuran en un 
guión. 

• Es semiestructurada cuando existe libertad para que el 
entrevistador introduzca ciertas preguntas según quién sea el 
entrevistado y en función del desarrollo de la entrevista. 

• En la entrevista en profundidad se perfila un guión general que 
no se ciñe a preguntas concretas. 



La elección entre los distintos tipos de entrevista dependerá de los 
objetivos que se persigan y de quién sea el que responde. Si se tratara 
de analizar un problema concreto, que exige una muestra amplia y 
opiniones inequívocas, se puede acudir a una entrevista estructurada. 
Si la muestra fuera reducida e interesara valorar las respuestas 
individuales, las entrevistas semiestructurada y estructurada pueden 
ser las más adecuadas. Cuando se trate de obtener información 
proporcionada por personas relevantes, como científicos, artistas, 
literatos, etc. lo aconsejable es la utilización de la entrevista en 
profundidad. 

2.4.4.2. Proceso de la entrevista en profundidad 

El guión. Una entrevista no se improvisa. El entrevistador debe 
preparar un guión y planificar cómo hará las preguntas. La forma de 
preguntar depende de tres factores, 

• La longitud de la entrevista. Obviamente, si la entrevista fuera 
corta no se pueden hacer preguntas largas. En entrevistas cortas se 
piden respuestas concretas, no divagaciones. 

• La naturaleza de la pregunta. Si la información que se desea 
obtener es compleja las preguntas deben formularse con mucha 
precisión y riqueza de matices, para que se comprendan bien y no den 
lugar a equívocos. 

• La naturaleza de la investigación. Si fuera exploratoria la 

entrevista sigue un guión poco estructurado. Por el contrario, en una 
investigación concluyente, el guión debe apoyarse en preguntas 
muy meditadas y estructuradas, si bien es cierto que la entrevista no 
suele emplearse en investigaciones de esta naturaleza, en beneficio 
del uso de cuestionarios que aunque guardan alguna relación con las 
entrevistas no son propiamente lo mismo. 

Fases. La entrevista comienza con una fase introductoria, cuyo 
objetivo es proporcionar información a la persona que va a ser 
entrevistada para conseguir mejor su colaboración. Se le informa 
sobre, 

• El objetivo de la entrevista. 

• El uso que se hará de la información que proporcione. 



• Lo que se espera del entrevistado a lo largo de la entrevista. 

En la fase introductoria, en definitiva, lo que se pretende es informar 
al entrevistado del objetivo de la entrevista para que colabore sin 
recelos y proporcione información fiable. Con otras palabras; se trata 
de romper el hielo. 

Desarrollo. Finalizada la fase introductoria, el entrevistador 
comienza a preguntar. Para ello debe trasladar los objetivos de la 
investigación a preguntas. El entrevistador debe tener en cuenta los 
siguientes aspectos cuando haga las preguntas. 

• No debe ser demasiado directo. Conviene que utilice rodeos. 
Las preguntas demasiado directas pueden proporcionar respuestas 
poco fiables, pues muchas personas puede que no respondan, o si lo 
hacen sea en los términos sociales aceptados, que no tienen por qué 
coincidir con sus opiniones. 

• Debe optarse por preguntas abiertas. Las preguntas cerradas 
procedentes de guiones estructurados recogen opiniones solamente, 
acuerdos o desacuerdos con afirmaciones que se leen. Las preguntas 
abiertas proporcionan respuestas más elaboradas e información más 
rica, relativa a puntos de vista, opiniones, motivaciones, actitudes y 
sentimientos. 

• Uso de antecedentes. Un antecedente es una pregunta que se ha 
formulado con anterioridad, y que sirve para profundizar en un tema o 
reconducir la entrevista. Permite relacionar preguntas, siguiendo un 
proceso continuo y lógico. Relacionando dos preguntas el 
entrevistador puede conocer si el entrevistado es coherente en sus 
respuestas o, por el contrario, responde forma errática. 

• Deben evitarse las preguntas que puedan dar la impresión de que 
el entrevistador espera una respuesta determinada. Algunas 
llevan implícita la contestación. Por ejemplo, no debería preguntarse 
¿qué opina UD. del problema que causan las drogas?, porque la 
respuesta es evidente y el entrevistado seguramente repetirá 
opiniones socialmente pactadas y tópicas. Sería mejor preguntar ¿qué 
soluciones sugeriría UD. para atajar el problema de la droga? 

• Deben evitarse las preguntas con carga emocional, 

obviando las palabras que puedan enfatizar en este sentido. Por 
ejemplo, no debería hablarse de los «pobres inmigrantes», o de «los 



indefensos niños». Deben evitarse los términos con carga afectiva, 
moral, espiritual o ideológica. De lo contrario, el entrevistador 
seguramente sesgará las respuestas, pues actúa como un juez. 

• La entrevista debe seguir un orden secuencial. Debe tener un 
principio, un intermedio y un final. Deben ordenarse las preguntas de 
forma que si el entrevistado se niega a seguir respondiendo en un 
momento determinado se minimice la pérdida de información. Por 
ejemplo se podría preguntar, 

- ¿Qué hace en su tiempo libre? 

- ¿De esas actividades, cuál es i a más importante para UD. ? -¿ Va 
mucho al cine? 

- ¿Le gustan las películas de aventuras? 

El interés de las respuestas a estas preguntas decrece a medida que 
se avanza en su formulación. 

2.4.4. J. Algunos factores que dificultan el desarrollo de las 
entrevistas 

• El tiempo. Una entrevista puede durar varias horas. Los 
entrevistados pueden manifestar sus reticencias a responder cuando 
se les informa de su duración, que podrían considerar excesiva. 

• El nivel cultural y la edad. A medida que decrece o se 
incrementa la edad aumentan las dificultades para recoger 
información mediante entrevistas. Las personas muy mayores o muy 
jóvenes no son las mejores candidatos para hacerles entrevistas. 
Cuando el nivel cultural es bajo también aumentan las dificultades 
para la realización de la entrevista. 

• Confusión por influencia del entrevistador. Los juicios o la forma 
de hacer las preguntas pueden frenar o falsear las respuestas. Por 
ejemplo, un entrevistador podría decir que «los cereales para 
desayuno son sólo para niños». Un adulto puede que no reconociera 
su consumo ante un entrevistador que estudiara los hábitos de 
consumo. 


2.4.4.4. Cuándo se utilizan las entrevistas 



Los investigadores proceden a entrevistar a las personas en las 
siguientes situaciones. 

• Cuando es preciso obtener información muy compleja, que no 
puede recogerse a través de preguntas simples como las que suelen 
figurar en los cuestionarios. Por ejemplo, cuando se trata de que un 
consumidor explique todas las fases que sigue para comprarse un 
coche; nacimiento de la necesidad, recogida de información externa, 
influencia de los grupos, actitudes ante las marcas, reglas de decisión, 
reducción de la disonancia, etc. En este caso no sirven las encuestas, 
porque las respuestas poseen muchos matices que una encuesta es 
incapaz de recoger. 

• Cuando las personas deban proporcionar información 
confidencial o delicada relativa a su vida, creencias, actos, 
preferencias, etc. Por ejemplo, la entrevista puede resultar muy 
adecuada para obtener información de personas con sida, que hayan 
sufrido alguna agresión sexual, que hayan sido toxicómanas o hayan 
ejercido la prostitución, que hayan estado en prisión, etc. 

• Cuando se desee obtener información de profesionales, como 
empresarios, artistas, modistos, cirujanos, etc. que pueden 
proporcionar opiniones y juicios muy ricos con relación a su actividad. 
En estos casos, los cuestionarios resultan un freno para obtener todo 
el potencial de información que estas personas pueden proporcionar. 
Es mejor dejarlas hablar libremente, guiando la conversación con un 
guión previamente elaborado. 

• También se pueden utilizar las entrevistas como fase previa para la 
elaboración de cuestionarios, pues las personas entrevistadas 
pueden ir definiendo, a partir de sus respuestas, los contenidos o las 
preguntas que convenga formular. 

2.4.5. La observación 

2.4.5.1. Concepto y aplicaciones 

Es una técnica cualitativa, primaria, estática, personal e indirecta. 
También se aplica en investigaciones exploratorias. Consiste en la 
atención, examen e interpretación de unas conductas sin que el 
investigador intervenga en su desarrollo con objeto de modificar el 
curso natural de su desenvolvimiento. Se aplica porque en ocasiones 



no es posible la colaboración de las personas para obtener 
información. Las razones pueden ser diversas. 

• Es posible que no deseen colaborar, porque se sientan 
incómodas. Por ejemplo, a un comprador en unos grandes almacenes 
le molestaría que alguien le acompañara para conocer el itinerario que 
sigue mientras deambula por ellos. A nadie le gustaría que otra 
persona le siguiera mientras hace la compra en el hipermercado. 

• Las personas puede que sean materialmente incapaces para 
proporcionar información. Los niños de meses no pueden de 
expresar sus deseos explícitamente, ni sus preferencias. Si un 
fabricante de juguetes quisiera hacer una prueba de algún producto, 
un oso de peluche, por ejemplo, podría dejar algunos modelos de este 
animal en una guardería y observar cómo juegan con él; si le tiran de 
las orejas, le muerden, le meten los dedos en los ojos, etc. El oso más 
deteriorado sería el que mayor éxito habría alcanzado. 

• Con frecuencia, las personas no proporcionan información porque 
no reparan en sus conductas, no son plenamente conscientes de 
ellas. Por ejemplo, una persona difícilmente recordaría la relación de 
páginas de una revista que acaba de leer y todos sus contenidos. 
Existe una técnica que consiste en pegar con una cola especial las 
páginas. Al pasarlas el adhesivo se rompe y ya no vuelve a pegar. De 
esta forma se puede conocer qué páginas y contenidos se han leído, o 
por menos, visto. 

• En ocasiones no interesa descubrir que se está procediendo 
a observar a otras personas. Por ejemplo, un inspector de 
vendedores en unos grandes almacenes no debe descubrirse como tal, 
pues de lo contrario aquéllos cambiarían su conducta. 

La observación recoge información en el momento de producirse los 
hechos. Puede hacerse de manera formal o estructurada, o 
informal o no estructurada. La primera persigue unos objetivos 
concretos de información, pensados y planificados antes de realizar la 
investigación. La segunda se limita a examinar conductas y extrae 
conclusiones generales. 

Un ejemplo de observación formal podría ser fijarse en si los 
consumidores perciben que una marca de leche ha cambiado de 
ubicación en el supermercado y si la buscan, al no encontrarla en el 



lugar habitual. Un ejemplo de observación informal podría ser fijarse 
en qué itinerario siguen los compradores en un hipermercado, dónde 
se paran, cómo deambulan, etc. De toda esta información se 
extraerían más adelante unas conclusiones, pero no han existido ni 
objetivos concretos, ni hipótesis previas de comportamiento. 

2.4.5.2. Condiciones para ia observación forma i 

Para que la observación pueda constituir una técnica de recogida de 
información cualitativa deben darse una serie de situaciones. 

• Los datos deben ser accesibles. El observador se interesa por 
conductas, por hechos observables y concretos que está viendo. Sólo 
se detectan conductas; si deseara conocer motivaciones, actitudes u 
opiniones deberían emplearse otros métodos de investigación. 

• La observación se aplicará para estudiar conductas que se 
suponen repetitivas, frecuentes o predecibles. Por ejemplo, se 
puede observar el itinerario de una persona en un hipermercado, pues 
la visita a este establecimiento será frecuente y formará, 
seguramente, parte de sus hábitos como consumidora. No tendría 
demasiado sentido observar cómo una pareja decide, en una 
inmobiliaria la compra de un piso, pues es una decisión esporádica, 
lenta, difícilmente predecible y condicionada por múltiples factores. 

• El suceso debe desarrollarse en un corto período de tiempo, 

pues de lo contrario varían las condiciones del entorno que afectan a 
las conductas. En cierto modo, la observación capta conductas 
impulsivas o rutinarias instantáneas. 

2.4.5.3. Escenarios para ia observación 

La verdad, es que existen muchos formas de observar, tantas como 
limite la imaginación del observador. Sin embargo, debe hacerse una 
referencia a cómo observar. En este sentido caben dos posibilidades. 
Puede haber observación, 

• En el entorno natural de las personas. Por ejemplo, se puede 
acudir a un hipermercado para observar la ruta que siguen los 
compradores. También se puede observar cómo se comportan las 
personas en su banco o mientras esperan al autobús, o cómo juegan 
los niños en una guardería. 



• En un entorno artificial, creado para estudiar los 
comportamientos o reacciones. Se puede simular un establecimiento 
comercial y ofrecer un producto para que sea probado, mientras se 
filman los hechos con una cámara oculta, o se contemplan a través de 
un espejo que permite ver sólo en un sentido. 

La creación de condiciones artificiales presenta algunas ventajas. La 
primera es que no hay que esperar a que los hechos sucedan. Además, 
en un laboratorio es posible disponer de muchos aparatos y medios 
para proceder a una mejor observación que en condiciones reales. El 
inconveniente de los laboratorios es que las personas saben que 
participan en una prueba, y que están siendo observadas, hecho que 
puede alterar sus conductas habituales. 

A continuación se exponen algunos ejemplos de la utilidad de la 
observación como fuente de recogida de información. 

• En un supermercado o hipermercado podrían conocer las zonas 
más transitadas observando simplemente la suciedad del suelo, o su 
desgaste. 

• El dueño de una tienda de ropa femenina podría fijarse en el tipo 
de joyas que llevan sus dientas para ofrecer una línea de 
complementos. También podría fijarse en cómo se maquillan, con 
idénticos fines. 

• Un restaurante podría detectar qué platos son los que rechazan 
los clientes -porque no los terminan- para retirarlos de la carta o 
modificarlos. 

• El dueño de un bar podría visitar otros bares y fijarse qué tipo de 
pinchos piden los clientes para ofrecerlos él también, en caso de que 
aún no lo hiciera. 

• Para valorar el éxito de una campaña sobre la recomendación de 
uso de cinturón de seguridad podría contarse el número de 
conductores que lo usan antes y después de la campaña. Para ello los 
observadores podrían situarse en los semáforos más transitados de 
una ciudad y fijarse, cuando estuvieran cerrados, en qué porcentaje 
de personas lo lleva puesto. 

• Para hacer una estimación del número de personas que tienen 
instalado aire acondicionado en sus casas, en un barrio, bastaría 



con contar los compresores que sobresalen de las fachadas. 


• El dueño de un túnel de lavado de coches, si se fijara en los que 
tienen tapicería de cuero, podría pensar en la conveniencia de ofrecer 
productos para su cuidado, o un servicio especial de limpieza de este 
tipo de tapicería. 

• Una agencia de publicidad podría fijarse en el dial de las radios 
de los coches que se encuentran en los talleres o túneles de lavado 
para conocer qué emisoras sintonizan los consumidores (sólo 
conductores), para estudiar la conveniencia de la emisora más 
adecuada para introducir cuñas publicitarias o programas de 
entretenimiento para conductores. 

• El número de bostezos de los espectadores es un buen indicador 
del «éxito» de una representación artística. 

Por su importancia merece un tratamiento especial la observación de 
residuos Los observadores pueden fijarse en qué se deposita en los 
contenedores de basura. Este proceder ha dado origen a una nueva 
«ciencia», llamada basurología (garbology), de la que es pionera la 
Universidad de Arizona, desde 1975. 

La búsqueda de restos en contenedores permite, 

• Estimar el comportamiento de consumidor de ciertos grupos 
sociales. Qué productos consumen, qué marcas, qué tamaños de 
envases, etc. es decir, se pueden estimar sus perfiles de consumo. 

• Estimar cuotas de mercado por grupos. Examinando el número 
de envases, paquetes o etiquetas por barrios, asociados a status 
socioeconómico se pueden estimar cuotas de mercado, por grupos 
socioeconómicos, con bastante aproximación. 

• Medir las reacciones de los consumidores ante el mix de 
marketing. Una disminución en los precios, un incremento de las 
actividades de promoción o un cambio en el envase pueden afectar a 
las ventas, cuya variación se obervaría en los contenedores de basura. 

• Conocer la efectividad -medida por los impactos- de campañas de 
marketing directo. Para ello se podrían contar las cartas tiradas a la 
basura sin haber sido abiertas. 



2.4.5.4. Medios técnicos para ia observación 


Los métodos para recoger la información mediante observación son 
tres: contar, medir y buscar pistas o restos. Suelen emplearse los 
siguientes. 

• Contadores de tránsito basados en células fotoeléctricas o de 

infrarrojos. Los contadores de tránsito los vemos con frecuencia en las 
carreteras. Sirven para conocer el tráfico que atraviesa determinados 
puntos de la red viaria. Al margen del interés para los responsables del 
tráfico o del urbanismo, las grandes superficies los pueden utilizar 
para conocer el incremento de visitantes consecuencia de actividades 
promocionales, por ejemplo, o para conocer cuántas personas pasan 
por las diferentes secciones y comparar su número con las que 
compran, etc. 

• Fotografías. La comparación de fotografías en el tiempo puede 
ser útil para estimar cambios en los comportamientos. La Diputación 
de Vizcaya fotografió desde el aire diversas playas vizcaínas en 
verano, antes de acometer inversiones de millones de euros en 
acondicionamiento y mejoras. Realizadas las obras, al año siguiente, 
las nuevas fotografías permitieron medir el poder de atracción de las 
obras realizadas. 

• Vídeos. Las grabaciones permiten obtener información como la 
proporción mujer/hombre de compradores, cómo se comportan los 
vendedores, qué itinerarios siguen los clientes, en qué se fijan, dónde 
se paran, cuánto tiempo permanecen en el establecimiento, etc. 

• Cámaras ocultas. En algunas pruebas, como test de producto o 
pretest publicitarios las cámaras ocultas permiten observar mejor las 
reacciones de las personas. También se aplican en los 
establecimientos comerciales con fines parecidos a los vídeos. 

2.4.5.5. Vaioración de ia observación 

Si bien la observación es una técnica muy útil -y barata- para recoger 
información cualitativa, adolece de algunas limitaciones. He aquí 
algunas. 

• La observación no destaca la motivación, ni explica el 
comportamiento del consumidor. Se conocen las consecuencias de los 



procesos de toma de decisiones, pero no sus mecanismos. 


• En las conductas observadas influyen variables de entorno que 

no siempre son tenidas en cuenta. Por ejemplo, en un hipermercado 
podría observarse si los consumidores reparan en una góndola en la 
que se ofrece una nueva sopa instantánea. Si el día fuera muy frío 
posiblemente los consumidores se comportarían de forma distinta de 
la seguida si la temperatura exterior fuera agradable. 

• La observación es una técnica estática. Recoge información de 
una conducta que se está observando en un momento dato. Esa 
conducta probablemente sea un hábito, o tal vez un comportamiento 
irrepetible. El observador nunca lo sabrá. 

• La percepción de lo que se observa es selectiva. El 

observador interpreta lo que ve. Tal vez otra persona llegara a 
conclusiones diferentes. 

• En la observación no se seleccionan muestras por 
procedimientos aleatorios. Se observan comportamientos de 
grupos de personas obtenidos por conveniencia o por detención. Esto 
significa que si el muestreo no es aleatorio no se pueden acotar los 
porcentajes de error. 

• La extrapolación de conclusiones es difícil. Esta es una 
característica, más que una limitación, de los métodos cualitativos. En 
principio sólo son generalizadles los resultados de muestras amplias, 
aleatorias y representativas de una población. Sin embargo, 
razonando con sentido común, sería poco probable que el observador 
se hubiera encontrado con una población rara. Con la debida cautela 
se pueden hacer tímidas extrapolaciones. 

• En caso de que la observación se produzca en un entorno no 
familiar se pueden producir reacciones en las personas que no 
sean las habituales en ellas. 

2.4.6. La pseudocompra 

Es una técnica cualitativa, primaria, estática, personal e indirecta. 
También se aplica en investigaciones exploratorias. AEDEMO la define 
«como la visita que realizan unos investigadores a detallistas u otros 



puntos de venta simulando que se trata de clientes normales que 
quieren comprar un producto o un servicio, o bien, asesorarse». 

Las personas que practica la pseudocompra no pueden identificarse 
como investigadores porque entonces alterarían los comportamientos 
de las que son investigadas. Por ejemplo, los evaluadores de la calidad 
de los establecimientos de hostelería que recogen información para 
elaborar guías turísticas como Campsa, Michelín o BMW, no deben 
identificarse como tales, obviamente. 

La pseudocompra es una técnica que permite obtener información 
sobre los siguientes aspectos, 

• Calidad de servicio prestado a los clientes por los distintos 
distribuidores, establecimientos o sucursales. 

• Grado de conocimiento que tienen sobre el producto o servicio 
que ofrece una empresa tienen los distribuidores. 

• Formación de las personas que están en contacto con el público. 

• Problemas o deficiencias que puedan observarse respecto al 
servicio al cliente. 

• Actitudes de los distribuidores o vendedores con relación a la 
oferta de la empresa respecto a la oferta de otros competidores, en 
caso de que se distribuyan productos de distintos oferentes; cuál se 
recomienda, que atributos destacan, etc. 

La pseudocompra es una investigación de mercados y quienes la 
llevan a cabo deben respetar las normas del código CCI/ESOMAR, 
especialmente las relativas al anonimato del informante. 
ESOMAR/AEDEMO proporcionan las siguientes directrices para llevar a 
cabo la pseudocompra, 

• Cualquier trabajo de pseudocompra debe diseñarse y realizarse de 
forma que no suponga una pérdida de tiempo ni de dinero, ni 

para el investigador ni para el investigado. 

• La investigación debe realizarse de forma que no se puedan 
identificar a las personas o establecimientos investigados. 



• La investigación debe realizarse mediante simples 
observaciones, cortas entrevistas o compras de duración 
normal. 

• La pseudocompra con fines de control, o de simular incrementos 
de la demanda, no es investigación de mercados, y está prohibida por 
el Código ICC/ESOMAR. 

• La pseudocompra también se puede realizar por teléfono. Por 
ejemplo, se puede preguntar, cuánto tiempo tardarán en reparar un 
coche sin necesidad de tener que llevarlo al taller. 

2.4.7. Las técnicas proyectivas 

2.4.7.1. Concepto 

Son técnicas cualitativas, primarias, estáticas, personales e indirectas. 
Una técnica proyectiva es un instrumento que permite conocer 
aspectos inconscientes de las percepciones, motivaciones, actitudes y 
conductas. Son técnicas cualitativas muy útiles en investigaciones 
exploratorias. Creadas por psicólogos, empezaron a emplearse en 
marketing, durante los años 50, debido a que muchos aspectos del 
comportamiento del consumidor no son conscientes. 

Existe un caso muy ilustrativo de aplicación de técnicas proyectivas. 
Cuando hace muchos años se introdujeron en el mercado, en Estados 
Unidos, los alimentos congelados se preguntó a las amas de casa 
sobre su uso. Muchas de ellas, tras probarlos, manifestaron su deseo 
de no consumirlos. La argumentación consciente proporcionada fue 
que no eran tan buenos como los frescos. Sin embargo, tras aplicar 
técnicas proyectivas los investigadores encontraron los verdaderos 
motivos del rechazo. Las amas de casa habían sido educadas para ser 
buenas esposas y madres desde una perspectiva muy tradicional. Los 
alimentos congelados suponían ahorro de tiempo. Para ellas ese 
ahorro de tiempo era una fuente de remordimientos, pues pensaban 
que por dedicar menos tiempo a cocinar para su familia la atendían 
peor. 


2.4.7.2. Clases de técnicas y aplicaciones 



Las técnicas proyectivas de mayor utilidad en investigación de 
mercados son las siguientes. 

• Asociación. Consiste en leer una lista de palabras y la persona 
que participa en la prueba debe responder con aquéllas que 
espontáneamente se le ocurran. La asociación de palabras es muy útil 
en marketing, especialmente para buscar denominaciones de 
marca, personalidad de marca e identificar atributos de 
productos. En la práctica, el test consiste en pronunciar una palabra 
y valorar sólo aquella respuesta que se proporcione en menos de tres 
segundos como máximo. Si el tiempo fuera mayor significaría 
ignorancia, confusión o falta de ideas claras, incluso en el 
subconsciente. 

• Construcción. Consiste en inventar historias o diálogos a partir de 
estímulos visuales, como fotos o dibujos. La técnica más conocida es el 
TAT (test de apercepción temática). En él se muestran fotos o dibujos, 
de productos, anuncios, etc. Las personas sometidas a esta prueba 
pueden aportar información muy valiosa sobre actitudes hacia los 
productos, imagen de empresa y factores que afectan la conducta 
de los consumidores. Por ejemplo, se puede mostrar una foto de 
una persona que esté mirando unas gafas de sol. Ante esta foto las 
personas pueden construir sus historias. Una podría decir se está 
fijando en el precio; sería un consumidor sensible a él. Una persona 
pesimista, o derrotista, podría decir que necesita unas gafas oscuras 
para disimular la picadura de una avispa en el párpado. Otra podría 
pensar que el observador pronto marchará de vacaciones y que por 
eso está mirando unas gafas que probablemente comprará. 

• Complementación. Consiste en completar frases sin terminar. El 
investigador comienza una afirmación que no termina, o muestra un 
dibujo o foto y la persona sometida a la prueba debe acabar las frases 
que se le proporcionan o explicar y/o justificar lo que ve en las fotos o 
dibujos. Es una técnica muy útil para detectar motivaciones o 
actitudes. 

Si se formulara la siguiente frase «los hombres que se compran un 
coche con motor Diesel...» caben diversas respuestas, que permiten 
detectar motivaciones o actitudes hacia ellos. Algunas de ellas 
podrían ser, por ejemplo. 


- «... se preocupan por economía». 



- «...lo hacen porque recorren muchos kilómetros al año». 

- «... no tendrán problemas con tiempo húmedo» 

- «... disfrutarán durante años de su coche». 

- «... se preocupan por el medio ambiente». 

Estas respuestas a una frase incompleta muestran motivos de uso y 
actitudes. Aparecen la economía, duración, la facilidad de 
mantenimiento, la resistencia a condiciones atmosféricas hostiles, o la 
ecología. 

• Expresión. Las técnicas de expresión se parecen mucho a las de 
construcción. En ellas se pide a las personas que representen el rol de 
otra, o que identifiquen a otras personas o entes con seres animados o 
inanimados. También sirve para medir imágenes o percepciones. 
Existen diversas técnicas. Las más importantes son el juego de 
papeles y la personificación. 

• En el juego de papeles (role playing) se pide a las personas que 
actúen en lugar de otras, que se pongan en su lugar. Así, se pueden 
conocer sus necesidades, deseos, emociones o motivaciones. Se 
podría pedir a una persona, un director financiero de una empresa, 
que actuara como director comercial y proporcionara argumentos para 
vender un producto. De esta forma podría conocerse cómo lo percibe 
él. 

• En la personificación se pide a las personas que participan en la 
prueba que materialicen en un ser vivo -que animen, en términos 
antropológicos- empresas, marcas, productos, etc. Por ejemplo, 
alguien podría decir que la empresa X, si fuera un ser vivo, sería un 
tiburón o un buitre. Este juicio es muy elocuente sobre la imagen que 
tiene de la empresa. Si opinara que tal vez fuera un perro pastor 
alemán estaría proporcionando una imagen positiva de la empresa, 
por todo lo que se asocia a esta raza de perros; nobleza, fidelidad, 
protección... 

Cuadro 2.3. Técnicas proyectivas y su utilidad en marketing 

Utilidad en la 

Técnica Concepto investigación de 

mercados 



Asociación 


Construcción 


Complementación 


Expresión 


Pronunciar palabras • Identificar la imagen de 
que constituyen marca 
una respuesta 

espontánea a otras * Buscar denominaciones 
que se proporcionan de marca 

• Identificar atributos 

• Posicionar productos o 
marcas 

• Proponer usos de los 
productos 

• Valorar la utilidad de los 
productos 

• Medir actitudes hacia los 
productos 

• Identificar factores que 
afectan o explican la 
conducta de los 
consumidores 

• Identificar motivaciones 
de consumo 

• Medir actitudes 

• Identificar motivaciones 
de compra o de rechazo a la 
compra 

Completar frases sin 

terminar • Descubrir usos de 

productos 

• Valorar atributos de 
productos, marcas, 
personas, organizaciones 

Representar el rol • Medir actitudes 
de otra persona 

Identificar personas * Medir percepciones 
o entes con seres 

• Medir imágenes 


Crear historias 
basadas en un 
estímulo 



animados o 
inanimados 


Fuente: Elaboración propia. 

2.4.7.3. Valoración de las técnicas proyactivas 

• Las técnicas proyectivas no se basan en cuestionarios largos o 
complicados. Bastan unas fotos o dibujos, o preguntas muy sencillas 
para que las personas proporcionen información de forma muy 
simple y sin fatiga. 

• En las técnicas proyectivas no se descubre el fin de la 
investigación. Las personas que participan en ellas no pueden 
adivinar para qué servirá la prueba. Responden con naturalidad, sin 
que sean capaces de introducir intencionadamente sesgos. 

• Como toda técnica cualitativa se interpreta de forma 
subjetiva. Las conclusiones pueden variar según quién sea el 
investigador. 

• Como todo resultado cualitativo no se debe generalizar, 

porque procede de muestras pequeñas y, generalmente, de 
conveniencia. 



Capítulo 3 


Fuentes de información 

(II). Fuentes 
cuantitativas 


3.1. Objetivos de capítulo. 

3.2. Fuentes cuantitativas. Concepto, características y clases. 

3.3. Bases de datos. 

3.4. Paneles de consumidores. 

3.5. Los paneles de detallistas. 

3.6. Paneles de audiencias. 

3.7. Evaluación de las bases de datos y paneles. Causas y 
criterios. 


3.8. La encuesta. 


FUENTES DE 
INFORMACIÓN (II). 

FUENTES 

CUANTITATIVAS 

3.1. OBJETIVOS DE CAPÍTULO 

A lo largo de este capítulo el lector conocerá los siguientes 
contenidos. 

• Qué son fuentes de información cuantitativas. 

• Qué son bases de datos. 

• Por qué se crean bases de datos. 

• Qué son bases de datos de escáner y cuál es su 
utilidad. 

• Que son bases de datos geográficas y cuál es su 
utilidad. 

• Qué son paneles de consumidores, de detallistas y de 
audiencias. 

• Cómo son los paneles Kantar y Nielsen y qué es el 
Estudio General de Medios. 

• Para qué sirven los paneles. 






• En qué aspectos hay que fijarse para evaluar las 
bases de datos y los paneles. 

• Qué son las encuestas, para qué sirven, qué clases se 
distinguen. 

• Qué criterios deben tenerse en cuenta para optar 
entre diversos tipos de encuestas. 


3.2. FUENTES CUANTITATIVAS. 
CONCEPTO, 

CARACTERÍSTICAS Y CLASES 


Las fuentes cuantitativas reciben este nombre porque la 
información que proporcionan se puede generalizar, debido 
a que se obtiene a partir de datos proporcionados por 
muestras aleatorias, amplias y representativas, que son 
analizados mediante la aplicación de técnicas estadísticas y 
matemáticas. Dentro de este grupo de fuentes se pueden 
distinguir las bases de datos, los paneles de consumidores, 
de detallistas y de audiencias, y las diversas clases de 
encuestas. 

Estas fuentes de información tienen las siguientes 
características. Pueden ser, 

• Secundarias o primarias. Algunas de las fuentes de 
información cuantitativas puede considerarse 
secundarias, porque ya existen en el momento de ser 
necesaria la información que contienen. Esto ocurre con 
las bases de datos o con los paneles. Sin embargo, las 
encuestas son por naturaleza primarias, porque se 





difunden en el momento en que se hace necesaria la 
obtención de información que proporcionarán. 

Estáticas o dinámicas. Una base de datos contiene 
información que se actualiza con determinada 
frecuencia. Si una empresa crea su propia base de datos 
esta fuente de información es dinámica. Si la base se 
compra a un tercero sin acordar la actualización de la 
información, la base de datos o el panel, son fuentes de 
datos estáticas. Las encuestas son, salvo excepciones, 
estáticas. Los códigos deontológicos prohíben encuestar 
a la misma muestra en dos momentos distanciados en 
el tiempo salvo que dé su consentimiento la primera 
vez que se entra en contacto con ella. 

Personales o impersonales; ciertas fuentes 
secundarias en algún momento requieren contactos con 
personas para crear la información, o necesitan de la 
presencia o colaboración de personas para poder ser 
aplicadas. Esto ocurre con los paneles, en general, y con 
la mayoría de la encuestas. Otras veces no es necesario 
el contacto personal, como ocurre con las encuestas por 
correo. 

Adecuadas para investigaciones exploratorias o 
concluyentes. Las fuentes cuantitativas pueden servir 
para realizar investigaciones exploratorias o 
concluyentes. Una base de datos o los resultados del 
análisis de la información que contiene un panel de 
consumidores se pueden comprar para hacer un estudio 
exploratorio. Sin embargo, lo más frecuente es que 
estas fuentes de información sirvan para desarrollar 
investigaciones concluyentes, especialmente 
investigaciones descriptivas que pueden servir para 
medir los resultados de decisiones tomadas, medir 
imagen, posicionamientos, segmentar el mercado, etc. 



Una encuesta nunca se utiliza para desarrollar 
investigaciones exploratorias. Para ello están las 
fuentes cualitativas. 


3.3. BASES DE DATOS 


Una base de datos en su acepción más amplia es, 
simplemente, una colección de informaciones relacionadas y 
accesibles conforme a algún criterio de selección. 

Las bases de datos pueden ser de distinta naturaleza. Para 
su correcta clasifícación nos basaremos en dos criterios; 
quién las crea y qué soporte se utiliza. Desde el punto de 
vista de quienes las diseñan y desarrollan pueden ser 
externas o internas. Las internas las crean los propios 
usuarios, como ocurre en una empresa que construya un 
fichero de clientes. Las externas las desarrollan 
organizaciones para su uso privado, o el de terceros, o 
ambas cosas a la vez. Por ejemplo, Dun & Bradstreet ha 
creado una base de datos de información de empresas que 
puede ser comprada por terceros para hacer consultas. El 
Instituto Nacional de Estadística en España recoge datos de 
utilidad para elaborar sus publicaciones de interés general, 
y también los proporciona a los investigadores a título 
gratuito u oneroso. 

Desde el punto de vista de su soporte, las bases de datos 
pueden ser bibliográficas o electrónicas. Las bases de 
datos bibliográficas, o sobre papel, son publicaciones 
convencionales en forma de libro. 

Las bases de datos electrónicas pueden tener soporte 
magnético, como los disquetes o las cintas magnéticas de 
ordenadores, o digital, como los discos CD/DVDROM. Este 



conjunto de soportes recibe el nombre de bases de datos 
electrónicas off-line (en español, sin conexión directa con el 
proveedor). Existen bases de datos mediante conexión 
telefónica convencional, y entonces reciben el nombre de 
bases de datos on-line. En estas bases lo que ocurre es que 
el investigador accede al ordenador del proveedor de 
información a través de línea telefónica. Para ello se habrá 
registrado como usuario, pagando una cantidad de dinero 
en concepto de alta, y también pagará por cada consulta 
realizada o por tiempo de conexión. 

La red Internet permite obtener información con unas 
características de uso muy cómodas para los investigadores. 
Finalmente, debe decirse que los criterios de clasificación 
expuestos se pueden combinar. Así, existen bases de datos 
internas o externas, que a su vez pueden ser bibliográficas o 
electrónicas. 


Gráfico 3.1. 

Fuente de información cuantitativa 
C^image 


3.3.1. Motivos para la creación de 
bases de datos 

Existen muchas informaciones importantes para las 
empresas que no aparecen en ninguna fuente secundaria, 
como, por ejemplo, las relativas a sus relaciones 
comerciales. Las fuentes secundarias o son rígidas, en el 
sentido de no estar diseñadas a medida de las necesidades 
de las empresas, o son estáticas, pues proporcionan datos 
referidos a un momento del tiempo, como las estadísticas. 
Otras veces, las fuentes primarias son instrumentos 


adecuados para obtener información, porque sea muy 
compleja o abundante. Por este motivo muchas empresas 
crean sus propias bases de datos internas, que se 
construyen a medida de las necesidades que surgen. 

Además de los motivos expuestos en el capítulo anterior, 
sobre la utilidad de la información secundaria en general, 
con relación a las bases de datos se pueden proponer 
motivos adicionales que justifican su conveniencia y 
utilidad. Son los siguientes. 

Características de las empresas 

Las propias organizaciones se encuentran interesadas en 
el diseño de sistemas de recogida y almacenamiento de 
información, independientemente de quién lo haga, por las 
siguientes razones. 

• La estructura organizativa de las empresas puede 
ser compleja, tener muchos niveles y dificultar los 
flujos de comunicaciones de la información. Las bases 
de datos siempre proporcionan de forma rápida 
información objetiva. 

• Las fuentes de información de las empresas - 
clientes, proveedores, distribuidores, etc.- pueden ser 
numerosas y no todas las personas tiene acceso a 
todas ellas. 

• Las empresas operan progresivamente con más 

combinaciones producto / mercado y eso dificulta 
el conocimiento global de la oferta de la organización y 
de sus actuaciones en los diferentes mercados donde 
actúa. 



• En una organización, la información puede 
desvirtuarse involuntariamente a medida que pasa de 
boca en boca debido a interpretaciones selectivas, o 
falsearse para evitar sanciones u ocultar gestiones 
deficientes. 

• Las fuentes de información útiles pueden estar muy 
dispersas en forma de libros, bases de datos, 
directorios, etc. 

Razones utilitarias para gestionar las organizaciones 

Además de los anteriores razonamientos, existen motivos 
que invitan a que las organizaciones empleen información 
secundaria bibliográfica y bases de datos internas o 
externas. Los objetivos perseguidos pueden ser, 

• Predecir el comportamiento de los consumidores a 

partir de las extrapolaciones de las tendencias de gasto 
observadas. 

• Desarrollar unas actividades de comunicación o 
promoción más efectivas, pues una base de datos 
interna puede reflejar los efectos de las campañas que 
llevan a cabo las empresas. 

• Medir la difusión de productos por segmentos de 
mercados, tras identificar el perfil de los compradores, 
en función de variables demográficas, 
sociodemográficas y geográficas. 

• Conocer el perfíl de sus consumidores y obtener 
tipologías de los segmentos importantes. 

• Examinar las tendencias que se aprecian en los 
segmentos: tamaño, evolución y poder de compra. 



• Identificar los determinantes demográficos de la 
demanda; género, edad, etc. 

• Identificar quiénes son los clientes principales, es 
decir, los habituales y quiénes son los esporádicos. 

• Encontrar nuevos nichos para estimar ventas 
actuales y futuras en ellos. 


3.3.2. Bases de datos internas a 
partir de información de 
escáneres 

Desde hace años, los lectores de códigos de barras 

son de uso común en los puntos de venta. El pago en 
establecimientos mediante tarjetas especiales que vinculan 
las compras a los clientes constituye una fuente de 
información fundamental para las empresas. Las ventajas 
que su uso proporciona son evidentes, porque se pueden 
conocer: 

• Los hábitos de compra de los consumidores en lo que 
respecta al día de la semana y hora en que compran. 

• El origen geográfico de los compradores, su 
procedencia. 

• La fidelidad de los consumidores, medible por la 
frecuencia de visita al establecimiento y los intervalos 
entre compras. 

• La preferencia por marcas y la asociación de marcas a 
perfiles de consumidores atendiendo a marcas 
nacionales, de distribuidor y propias. 

• La composición de la cesta de la compra y su importe. 



• La oportunidad de considerar segmentos sensibles a 
actividades de marketing como promociones, rebajas, 
ofertas, buzoneo, PLV, etc. 

• Facilitan el control de existencias en almacén y su 
valoración contable. 

• Minimizan el riesgo de marcado erróneo de productos, 
en beneficio del cliente. También se agiliza el tiempo de 
espera en las colas. 

• Permiten separar los datos que un ordenador central 
recoge de diversos puntos de venta, por provincia o 
centro comercial. Los escáneres permiten determinar de 
forma instantánea el efecto de cambios en los precios, 
valor de las ventas y grado de aprovisionamiento de 
stocks para atendera la demanda. 

• Los escáneres permiten analizar los efectos de ciertas 
alteraciones de mix de marketing, como promoción 
en el punto de venta, ofertas, cambios en la distribución 
en las estanterías, etc., lo que los convierte en 
instrumentos de extraordinaria utilidad para desarrollar 
procesos de experimentación comercial. 

Pese a las indudables ventajas de estas herramientas, 
existen algunas limitaciones. La más importante es que no 
analizan las motivaciones de los consumidores. 

3.3.3. Bases de datos 
geodemográficas 

El geomarketing puede definirse como la investigación de 
mercados y atención a los consumidores empleando para 
ello en bases de datos que contienen información relativa a 
sus características demográficas y socioeconómicas 
vinculadas a una localización geográfica. 



Durante muchos años, las variables geodemográficas han 
sido las más empleadas para segmentar los mercados. Las 
variables geodemográficas hacen referencia la edad, género, 
tipo de unidad familiar en la que viven, número de hijos, 
nivel de renta, etc., vinculando estas características al lugar 
donde viven las personas. 

Estas variables son muy importantes para las empresas 
que deseen construir sus bases de datos, porque a través de 
ellas se puede medir el tamaño y la composición de los 
mercados actuales y potenciales, así como su poder 
de compra. Los cambios en las variables geodemográficas 
pueden poner de relieve oportunidades y amenazas. Por 
ejemplo, el estudio de la composición de la población 
muestra que el envejecimiento observado reducirá los 
mercados de bienes y servicios para jóvenes e incrementará 
el de las personas mayores. Un mercado se contraerá, otro 
se expansionará, y cambiará la demanda en términos 
cualitativos y cuantitativos. La utilidad de las variables se 
desprende de sus características. Estas son las más 
relevantes. 

• Son fáciles de obtener. El Instituto Nacional de 
Estadística y sus equivalentes autonómicos 
proporcionan información sobre gran parte de las 
variables geodemográficas. 

• Muchas características geodemográficas se 
pueden proyectar. Por ejemplo, se pueden hacer 
previsiones de evolución de la población, y determinar 
el tamaño aproximado de ciertos segmentos naturales 
en un futuro próximo. Las pirámides de edades resultan 
muy útiles en este sentido, pues permiten hacer 
estimaciones de la probable población futura por 
edades y género. 



• Facilitan las tareas de segmentación de 
mercados, pues las empresas pueden conocer quién 
compra -hombre, mujer, joven, adulto...- y qué compra. 

Las fuentes de información demográfica en España se 
encuentran en los Censos de Población que los ciudadanos 
cumplimentamos cada cinco años, así como en las 
estadísticas del INE y otras privadas. Sin embargo, la 
disponibilidad de estos datos por personas individuales no 
se extiende a usos comerciales. Son propiedad de los 
organismos que los obtienen y se reservan el derecho de 
explotarlos con fines estadísticos o de control. 

Las variables geodemográficas clave que las 

empresas deben tener en cuenta en el diseño de sus bases 
de datos son las siguientes. 

• Edad, clasificada en grupos de cinco en cinco años, 
que es la nomenclatura habitual. 

• Tipo de hogar. Las necesidades de las familias y sus 
actos de consumo no son las mismas. Dependen de su 
estructura. En este sentido resulta muy útil el concepto 
de ciclo de vida familiar. Las fases por las que pasa la 
familia son las siguientes. 

1. Etapa de soltería, generalmente coincidente con la 
entrada en el mercado laboral. 

2. Parejas recién casadas sin hijos. 

3. Nido lleno I. Matrimonio con hijos menores de 6 años. 

4. Nido lleno II. Matrimonios con el hijo más joven 
mayor de 6 años. 

5. Nido lleno III. Matrimonios mayores con hijos 
dependientes adolescentes o jóvenes. 



6. Nido vacío I. Matrimonio con hijos independientes 
que acceden al mercado laboral. 

7. Nido vacío II. Matrimonio con el cabeza de familia 
jubilado sin hijos en casa. 

8. Superviviente solitario que aún conserva su empleo. 

9. Superviviente solitario jubilado. 

Es fácilmente adivinadle que la cuantía de los ingresos y 
el destino de los mismos ha de variar forzosamente a lo 
largo del ciclo de vida familiar. La adquisición de la vivienda, 
muebles, automóvil, mantenimiento y educación de los hijos 
son gastos característicos de etapas del ciclo de vida 
familiar hasta las fases de nido lleno III. En las fases de nido 
vacío los gastos de la familia pueden ir orientados más a 
vacaciones, artículos de lujo o diversiones. Los 
supervivientes solitarios pueden mantener esta última 
estructura de gastos, pero otros, relativos al cuidado de la 
salud, por ejemplo, se incrementan. 

• Clase social, definida por el nivel cultural, el empleo, 
status y la renta. A las empresas les debe interesar 
conocer la estratificación social de la población pues el 
comportamiento en materia de consumo de cada clase 
social es diferente y esas diferencias se observan en, 

1. Actitudes. Las clases media-alta y alta miran hacia 
el futuro, son más racionales y más seguras de sí 
mismas que las demás, y tienen esquemas de 
preferencias más amplios. 

2. Aprendizaje pues a mayor nivel social mayor 
capacidad de aprendizaje y de adopción de nuevos 
productos. 



3. Consumo, pues el comportamiento por clases 
sociales puede resumirse en que las estructuras 
cuantitativa y cualitativa de la compra son diferentes. 
A mayor nivel social más gasto en servicios (seguros, 
vacaciones, etc.) y en bienes de lujo (antigüedades, 
joyas, objetos de decoración, etc.). También, su 
elasticidad precio es menor y son diferentes el lugar y 
la frecuencia de compra. 

4. Lugar de compra. La clase baja prefiere pequeños 
establecimientos próximos al domicilio y suele hacer 
la compra a diario. La alta se aleja para hacer las 
compras y las realiza con carácter más esporádico. 

5. La búsqueda de información es distinta. Los 
mecanismos de obtención de información y su 
calidad mejoran a medida que se asciende en la 
jerarquía social. La influencia de los grupos de 
convivencia es menos importante en las clases altas 
que en las bajas. 

6. La percepción de riesgo por parte del consumidor 
también es distinta. Las clases menos favorecidas lo 
perciben con mayor intensidad que las más altas. 
Esto tiene repercusiones sobre el significado de las 
marcas, más intenso en las clases más bajas, que se 
guían por ellas como estrategia para reducir el riesgo 
percibido, o consecuencias negativas de una elección 
poco acertada. 

Las empresas que deseen crear bases de datos con 
información geodemográfica deben seguir los siguientes 
pasos. 




Identificar fuentes fiables. Estas fuentes pueden ser 
organismos públicos como el INE u otros de naturaleza 



autonómica. 


• Delimitar el territorio o mercado que se desea 
analizar; provincia, comunidad autonómica, región 
geográfica, región Nielsen, etc. 

• Elegir el formato. Los datos pueden estar recogidos 
en papel impreso, o en soporte magnético, disquete o 
cinta de ordenador o CD/DVD-ROM. 

• Valorar los costes. Recoger información y crear 
bases de datos cuesta dinero. Almacenarla y explotarla, 
también. Sólo merece la pena el esfuerzo si esa 
información va a ser empleada con frecuencia. De lo 
contrario es preferible comprarla a terceros cuando sea 
necesario. 

A continuación se muestran tres cuadros en los que 
figuran la composición familiar, la distribución de cuartos de 
las viviendas y el nivel cultural de la población de una 
ciudad para diversos distritos. Un examen sencillo de las 
tablas, sin ánimo de exhaustividad, pone de manifiesto que, 

• Las familias mayores viven en el distrito D3. 

• En D3, es donde hay más niños y en general, las 
familias son más jóvenes en D3. 

• Las familias más reducidas viven en D5. 

• El distrito más envejecido es D6. 

Considerando determinados consumos, como 
medicamentos pediátricos, estilos musicales, películas, ropa, 
pañales o hemodinámicos cerebrales, se encuentran 
asociados a la edad. El análisis de esta tabla puede ser de 



utilidad para orientarse de forma más efectiva a los 
consumidores, tanto para orientar la oferta como para 
localizar los puntos de venta. 


Cuadro 3.1. Composición familiar según la edad, el género y el tamaño 
de la familia medidas en unidades 


Barrio 

Familias 

Varones 

Mujeres 

0-5 

años 

0-19 

años 

20-64 

años 

65-79 

años 

80y 

-t-años 

Tamaño 

familiar 

Total 

117022 

1,51 

1,64 

0,15 

0,73 

1,98 

0,44 

0,09 

3,15 

DI 

17061 

1,56 

1,67 

0,16 

0,76 

2,04 

0,43 

0,08 

3,24 

D2 

14281 

1,53 

1,66 

0,13 

0,74 

2,06 

0,39 

0,08 

3,19 

D3 

7855 

1,75 

1,74 

0,24 

1,01 

2,18 

0,30 

0,05 

3,49 

D4 

15658 

1,60 

1,68 

0,15 

0,84 

2,10 

0,33 

0,07 

3,28 

D5 

17443 

1,40 

1,53 

0,14 

0,65 

1,81 

0,47 

0,10 

2,93 

D6 

18118 

1,36 

1,67 

0,12 

0,57 

1,85 

0,62 

0,17 

3,04 

D7 

15829 

1,49 

1,61 

0,13 

0,66 

1,97 

0,47 

0,10 

3,10 

D8 

10777 

1,53 

1,63 

0,17 

0,79 

1,99 

0,38 

0,08 

3,16 


Klimage 

Este cuadro puede servir para tener una localización 
aproximada de la población por clases sociales. El 
equipamiento doméstico es una variable proxy para medir la 
clase social a la que pertenece una familia. El número de 
baños también lo es. Según los datos del cuadro 3.2 la clase 
social más favorecida vive en el distrito D6, y menos 
favorecida en el D5. 


Kimage 

Existe una relación entre cultura y clase social. Del cuadro 
3.3 se deduce que la clase social más favorecida vive en D6, 
y la menos en D3 y D5. Empresas editoriales, agencias 
turísticas, de idiomas o vendedores de ordenadores, 
establecimientos comerciales podría tomar decisiones muy 
acertadas de oferta de productos o de localización de 
instalaciones tras el examen de este cuadro. 





















3.3.4. Diseño y gestión de una base 
de datos interna 

Las bases de datos se componen de registros, a veces 
llamados páginas, formados por campos. Por campo de una 
base de datos se entiende un criterio, característica de la 
información o cualidad para acceder a su contenido. 
Registro es un conjunto campos mutuamente relacionados 
con la información que se maneja. 

Por ejemplo, en una ficha de cartulina clásica de un 
fichero de una biblioteca, los campos son, el título del libro, 
la materia que trata, el nombre del autor, la editorial que 
publica el libro y el año. El registro es la ficha en sí misma, el 
conjunto de campos relacionados entre los que existe una 
correspondencia: todos los datos que caracterizan a una 
misma publicación. Cada ficha o registro contiene, en este 
ejemplo, cinco campos. 

Cualquier base de datos que se cree, y especialmente las 
internas, debe cumplir con los siguientes requisitos. 

• Su diseño debe permitir añadir datos en cualquier 
momento y poder editarlos, para corregirlos o 
eliminarlos. 

• La base debe permitir el acceso a los datos para 
poder proceder a su consulta. 

• Las bases de datos deben permitir clasificar la 
información, de forma simple o booleana, es decir, 
introduciendo restricciones en términos «y», «o». 

• Debe ser posible extraer o exportar los datos para 
su análisis. La recuperación de datos se efectúa 
siguiendo algún criterio; por ejemplo, clientes 
localizados en Levante o clientes que representen más 



del 5% de las ventas de la empresa. También deben ser 
posible la exportación de datos en forma de tablas que 
puedan ser tratadas utilizando programas informáticos 
específicos. 

Teniendo siempre en cuenta estos principios, el diseño de 
la base requiere contar con dos sistemas, que son el humano 
y el de la gestión. 

El sistema humano de la base de datos tiene como 
misión diseñar, dar contenido a la base de datos y 
alimentarla. El sistema de gestión opera con ella desde el 
punto de vista del usuario. El equipo humano que gestiona 
una base de datos interna lo componen las siguientes 
personas. Ver cuadro 3.4. 


Cuadro 3.4. Sistema humano de una base de datos 


Persona 

Funciones 

generales 

Funciones 

específicas 

Responsable 
de información 

• Definirla 
naturaleza de la 
información que 
debe contener la 
base 

• Revisar 
periódicamente el 
trabajo de 
recogida de datos 

• Valorar qué tipo 
de decisiones se 
toman 

• Decidir qué clase 
de información 
hace falta para 
tomar las 
decisiones y con 
qué frecuencia 

• Buscar dónde se 
puede conseguir 
la información 

Documentalista 

Alimentar la base de 
datos 

• Seleccionar 
información 









• Evaluar 
información 

• Extraer datos 
relevantes 

• Aplicar técnicas y 
criterios de 
localización y 
acceso a la 
información 

• Diseño del 
sistema 

• Posibilitar el 
cruce de la 
información 

• Programar la base • Depurarla 
Especialista en de datos información 

informática • Configurar el • Actualizar la base 

software • Incorporar 

campos nuevos 

• Eliminar de 
información no 
interesante, 
anticuada 

Operadores Manejar físicamente Atender y orientar a 

la base los usuarios para 

realizar las 

consultas 

3.3.5. Problemas observados en la 
práctica en el desarrollo e 
implantación de bases de datos 
internas 










Desde un punto de vista técnico crear una base de datos 
no plantea dificultades especiales. Su diseño, los códigos de 
clasificación y acceso no representan ninguna complejidad 
para un informático o un documentalista. Donde realmente 
aparecen dificultades es en la adopción de una gestión de 
marketing de bases de datos. Los problemas fundamentales 
son cuatro. 

• Puede ocurrir que una base de datos interna, 
alimentada por los empleados de la empresa, se perciba 
como un instrumento de control y no existe, 
generalmente, cultura de compartir información, o 
confianza en su fiabilidad. 

Si bien una base de datos interna resulta 
extraordinariamente útil para la gestión de una empresa, los 
niveles inferiores de la estructura organizativa lo perciben 
como un instrumento de control. Creen que los cuadros 
superiores lo implantan para poder hacer seguimientos de 
sus actividades más pormenorizados y continuados. Estos 
recelos tienen efectos negativos en la contribución de 
información, que se limita a la mínima imprescindible que 
deben aportar. Otra que pudiera resultar muy útil tal vez no 
se proporcione, por no tener carácter obligatorio. 

• En segundo lugar, los celos profesionales 

constituyen un freno importante para la implantación 
de las bases de datos internas. Algunas personas tal vez 
no deseen aportar información porque puede favorecer 
a otras. 

• En tercer lugar, los directivos quizá no tengan 
demasiada confianza en una base de datos interna, 
por falta de cultura informática o porque crean que la 
información que se introduce en ella no es fiable. 



• La falta de cultura sobre el uso de la información 

puede ser un freno a la adopción de bases de datos 
internas. El filósofo Bacon afirmó hace siglos que «la 
información es poder». La informática permite el acceso 
a mucha información hasta hace poco tiempo reservada 
a un grupo de personas reducido. Este hecho ha 
supuesto una modificación en la estructura organizativa 
de muchas empresas, que han reducido el número de 
niveles de sus organigramas. Esto ha sentado ante la 
misma mesa a personas de «diferente rango» y ha 
quebrado algunas expectativas de promoción 
profesional. Compartir la información es compartir 
poder. A veces es difícil conseguirlo. 

• Aspectos éticos. La obtención de datos para crear 
bases debe planificarse con esmero. Las empresas 
deben decidir si serán ellas las que nutran de 
información sus bases o, por el contrario, la adquirirán a 
proveedores externos. Cabe, pues, distinguir dos 
fuentes de procedencia: datos obtenidos a partir de 
estudios de mercado -de información primaria o 
secundaria- o de consumidores que cumplimentan 
garantías, fichas, cupones de respuesta, etc. y datos 
que se adquieren a terceros, otras empresas que crean 
bases de datos. 

Un hospital podría desarrollar una base de datos de sus 
pacientes. Esa base podría servir para recordarles, 
transcurrido cierto tiempo, tras una intervención quirúrgica, 
la conveniencia de un examen de control. Esa base podría 
servir para detectar personas portadoras del virus del sida. 
Mal utilizada podría tener unos efectos sociales dramáticos. 

En el mundo existen bases de datos privadas de algunas 
comunidades perteneciente a subcultura. Las bases de 
datos sociodemográficos pueden contener información que 



mal empleada podría favorecer la persecución por motivos 
raciales o étnicos, políticos o religiosos. Los ordenamientos 
jurídicos deben procurar y garantizar el buen uso de la 
información. La LORIAD española se encamina a ello. En 
cualquier caso, la palabra ética debe subyacer, al margen de 
los tecnicismos de los ordenamientos jurídicos. 


3.4. PANELES DE 
CONSUMIDORES 


Los paneles son muestras aleatorias, estratificadas, 
representativas de consumidores o establecimientos 
detallistas que proporcionan información periódica sobre 
determinadas variables o comportamientos. Constituyen 
fuentes de información cuantitativa, secundaria, dinámica 
personal y directa. 

Se pueden distinguir paneles de consumidores, paneles de 
detallistas y paneles de audiencias. El panel es por 
naturaleza un instrumento dinámico. En líneas generales la 
información que proporcionan los distintos tipos de paneles 
figura en el cuadro 3.5. 


Cuadro 3.5. Información general que proporcionan 

los paneles 


Paneles de 
consumidores 

Paneles de 
detallistas 

Paneles de 
Audiencias 

Estructura de gasto de 
los hogares 

Comportamiento 
de ventas y 
existencias de 
productos y 
marcas 

Atención a 
medios de 
comunicación 












Tamaño del mercado y 
y tendencias 
observadas 

Importancia de 
los mercados y 
tipos de 

establecimientos 

Estructura de las 
audiencias; por 
edad, género, 
franjas horarias, 
días, etc. 

Características de los 
consumidores 

Estructura de 
mercado de las 
marcas y sus 
formatos 

Audiencia de los 

diferentes 

soportes 

Precios de los 
productos 

Porcentaje de 
establecimientos 
que tienen el 
producto 
genérico y sus 
marcas en stock 

Características 
de la audiencia 

Concurrencia de las 
compras 

Posicionamiento 
de marcas 
propias y de la 
competencia 

Evolución de 
anuncios y GPRS 


Fuente: García Cruz, R. y Fernández Fernández, J. C. (2000). 


3.4.1. Metodología para la creación 
de los paneles de consumidores 

Para formar un panel han de seguirse una serie de fases 
que se resumen en el cuadro 3.6. y que se explican con más 
detalle tras él. 

• El diseño general de los paneles requiere definir qué 
información será necesaria, cuál es el universo que la 
proporcionará, cuál será el tamaño de la muestra, 
dónde y cómo se localizará, cómo se conseguirá su 










colaboración y durante cuánto tiempo. Por ejemplo, 
para analizar el comportamiento de los consumidores 
en materia de consumo de productos lácteos debe 
definirse el universo, que son los hogares que existen 
en España. 

Cuadro 3.6. Formación de los paneles 


Fases a seguir 

Decisión que hay que tomar 

Diseño inicial del panel 

• Definir la información que se 
desea obtener y analizar 

• Definición del universo o 
población que puede 
proporcionar la información 

• Determinación del tamaño de la 
muestra necesaria 

• Selección de la muestra 

• Localización de la muestra 

• Conseguir la cooperación de los 
panelistas 

• Prefijar la duración del panel y 
de los panelistas 

Definir la frecuencia de 
la recogida de 
información 

Dependiendo de la naturaleza de 
los productos y de la urgencia en 
disponer de la información para la 
toma de decisiones, la frecuencia 
de obtención de información puede 
ser diaria como las audiencias de 
TV, semanal o mensual como 
ocurre con los alimentos, o 
trimestral como sucede con la 
ropa. 

Decidir cuál será el 
soporte de la 

Físico, como un diario, o 
electrónico a través de Internet o 











información 

e-mail 

Mantener la 
representatividad del 
panel 

Sustituir a los panelistas por otros 
de similares características cuando 
abandonan el panel 

Analizar los datos 

• Determinar qué técnicas 
estadísticas se emplearán 

• Decidir que programas 
estadísticos serán los más 
convenientes 

Presentar informes 

• Estándar; informes periódicos 
que se ofrecen conforme aun 
diseño preestablecido y 
acordado que resume los 
principales resultados en forma 
de tablas y gráficos. 

• Especiales: infórmese medida 
de los deseos de los clientes que 
se presentan y exponen 
personalmente 


Fuente: Elaboración propia. 


• Una vez definido el universo o población se hace 
necesaria su cuantificación para determinar el tamaño 
de la muestra que de él se extraerá. El universo de 
hogares en España se corresponde con una población 
de 16.000.000 de unidades, aproximadamente. 

• Una vez identificado el universo y sus características, 
así como el tamaño de la población, debe extraerse una 

muestra aleatoria estratificada. En el caso de un 
panel de hogares el tamaño de la muestra es de 5.000 
hogares localizados en diversas regiones o zonas de 











España, que sean representativas de la población según 
criterios geográficos y socioeconómicos. 

Una vez cuantificada y perfilada la muestra es 
necesario entrar en contacto con ella. En España 
el reclutamiento de panelistas suele hacerse mediante 
entrevistas tras localizar la muestra mediante rutas 
aleatorias en los hábitats donde residen. En ellas se 
expone lo que significa ser panelista y lo que se espera 
de la persona que pertenece al panel. En esta fase de 
formación se identifican las características 
sociodemográficas de los panelistas: la edad del ama de 
casa, clase social, tamaño de la familia, presencia de 
niños, profesión, poder adquisitivo y otras 
características del hogar. También se les asigna un 
número de panelista que figurará en la documentación 
que envíen, para no tener que hacer constar todos sus 
datos sociodemográficos en cada envío. 

A los panelistas debe explicárseles la frecuencia de 
recogida de información. La periodicidad de los envíos 
depende de la urgencia de la necesidad de disponer de 
los datos. Las frecuencias más habituales son de 
carácter semanal o mensual, como en el caso de 
cosméticos, o alimentos. Tratándose de gastos en 
automóvil, materializados en mantenimiento o 
reparaciones, la frecuencia es, lógicamente, menor. 

Además de determinar con qué frecuencia debe 
proporcionarse la información, es necesario elegir el 
soporte que se empleará para recogerla. Tratándose de 
bienes de consumo la información se recoge por escrito 
en unas hojas ya impresas, que forman una especie de 
diario o periódico. Es importante la forma en que se 
estructure el diario -su diseño o formato- porque ello 
puede afectar a la precisión de la información. En 



general debe optarse por un formato que facilite la 
memoria y que no sea difícil de responder, pues en tal 
caso la negativa a colaborar es muy probable y cabe, 
incluso, la falsificación de los datos. Se han hecho 
algunos estudios en los que se ha podido comprobar 
cómo el diseño de las páginas, la posición de las 
preguntas, etc. puede influir en la calidad y fiabilidad 
de la información. Las empresas deberían ensayar 
diversos formatos para decidir el más conveniente. Para 
ello pueden emplear una técnica cualitativa, un 
experimento de laboratorio. 

Una vez constituido el panel debe conseguirse 
cooperación y para ello se explica qué es el panel, 
cuál es su utilidad, qué se espera del panelista y cómo 
se le compensará. En este sentido, las empresas 
pueden optar por una cantidad fija periódica o por 
regalos por acumulación de puntos que se otorgan a 
medida que se remite la información acordada. En 
España el INE paga un «sueldo» mensual a las familias 
que proporcionan información sobre sus actos de 
consumo. Las empresas privadas proporcionan regalos, 
retribución en metálico, o algún servicio, como 
asesoramiento económico o financiero, en caso de los 
detallistas, etc. 

Duración del panel. En el momento de entrar en 
contacto con el panelista también se le explica el 
horizonte temporal de su colaboración. En principio, 
los paneles se diseñan para que duren un tiempo 
indefinido. 

Mantenimiento de la representatividad. Para 
conseguir continuidad en la colaboración de los 
panelistas los institutos de investigación de mercados 
deben ofrecer incentivos. Someterse a la disciplina que 



supone reflejar la información requerida es difícil para 
algunas personas. Por ello, no es de extrañar que un 
porcentaje elevado de panelistas abandone su 
condición, o no proporcione la información completa. 
Otras veces los panelistas, y por ende los paneles, 
pierden representatividad, porque cambian sus 
características socioeconómicas o demográficas. Por 
otra parte, los paneles son dinámicos. Mueren por 
causas naturales. Una mujer cuyo hijo pase de dos años 
dejará de ser panelista de un panel de bebés. La 
duración de un panel también depende la frecuencia de 
envío la información. Cuanto menor sea la frecuencia de 
envío de información, mayor será la desmotivación de 
los panelistas para colaborar. Estas situaciones pueden 
acarrear problemas de representatividad, pues la 
muestra efectiva acaba siendo menor o diferente de la 
necesaria para poder inferir resultados. El panelista que 
abandone debe ser sustituido por otro de similares 
características. Esto cuesta muchos esfuerzos y dinero, 
pero los institutos que crean paneles lo saben de 
antemano. El mantenimiento de la representatividad de 
los paneles orientada al reemplazo de unidades 
muéstrales es una actividad obligada, que debe 
realizarse con mucho esmero. 

Los institutos que desarrollan paneles venden a sus 
clientes la explotación de los datos. Cuando diseñan el 
panel definen el contenido de la información que 
servirá de base para vender sus informes. Estos pueden 
estar estandarizados y limitarse a datos y análisis 
acordados de antemano con los clientes, o por el 
contrario, informes a medida, específicos y 
puntuales que puede ser solicitados en un momento 
dato. 



3.4.2. Paneles de consumidores 


Un panel de consumidores lo constituye una muestra 
estable de personas que proporciona información sobre sus 
actos de consumo y otras variables de comportamiento. 

La historia de los paneles es relativamente reciente. 
Aparecieron en los años 20, tras la I Guerra Mundial. Uno de 
los primeros se diseñó en 1938, para estudiar las reacciones 
de los lectores de la revista Woman's Home Companion. En 
este mismo año se diseñó otro para estudiar la conducta de 
compra de los consumidores y las preferencias por las 
marcas. Durante los 40 se emplearon para estudiar las 
conductas de votos y hacer algunos test de producto, 
alimentos principalmente. A principios de los 50 se 
emplearon los paneles para estimar audiencias de radio. 
Durante los 50 se usaron para hacer estudios de fidelidad a 
la marca. A partir de los 60 su uso se ha generalizado y son 
muchas sus aplicaciones. 

5.4.2.1. Clases de paneles 

Existe diversidad de paneles, que se pueden clasificar, en 
líneas muy generales siguiendo diversos criterios (Butiñá 
Jiménez, 1992). 



Cuadro 3.7. Clases de paneles de consumidores 


Según las unidades 
muéstrales 

Personas o grupos que 
proporcionan la información 

• Paneles de Hogares 

• Paneles de individuos 

Productos específicos 

• Panel de Automóvil 

• Panel de Bebés 

• Panel de Perfumería 

• Panel de Textil y calzado 

• Panel de Productos 
farmacéuticos 

Sistema de recogida 
de datos 

Postales 

La información se envía por correo 

Home audit 

Una persona recoge la información a domicilio 

Dustbin check 

Los papelistas guardan en una bolsa etiquetas, 
pruebas de compra o envases, códigos de 
barras, etc. que posteriormente es recogida 
por la empresa que realiza las investigaciones 

Especiales 

Test de 
producto 

Los integrantes pueden ser periódicamente 
encuestados para realizar test de producto 

Electrónico 

La muestra de papelistas se controla mediante 
tarjetas especiales que ai pasar por las cajas 
en el momento del pago vinculan la compra a 
las características del consumidor 


l 'iienie: Llaboración propia. 


3.4.2.2. Los paneles Kantar World Panel 

Dympanel fue una empresa creada en 1973 en España. 
Actualmente se encuentra integrada en el grupo Kantar. 
Ofrece los siguientes paneles de consumidores. 

Klimage 

Kirnage 

Características del panel de Hogares 

Las zonas geográficas que analiza Kantar World Panel, 
en las que obtiene información, son las que aparecen en el 
cuadro 3.9. 












Kümage 

El panel estudia los comportamientos atendiendo a 
variables relativas a los siguientes hábitats y perfiles 
sociodemográficos. 

• Hábitat; población con menos de 5.000 habitantes, de 
5.001 a 30.000, de 30.001 a 200.000 y áreas 
metropolitanas. 

• Perfiles sociodemográficos; edad del ama de casa 
(menos de 35 años, de 35 a 49 y más de 50 años); nivel 
socioeconómico (clase alta, media-alta, media, media- 
baja y baja); tamaño del hogar (1 y 2 personas, 3, 4, 5 y 
más personas); presencia de niños en el hogar (sin 
niños, con niños de 0 a 5 años, con niños de 6 a 15 
años). 

La muestra del Panel de Hogares, 5.000 hogares, es 
proporcional al tamaño de la región. Esto significa que si en 
Madrid vive el 20 de la población, la muestra de Madrid 
debe tener un 20% de los hogares, 1.000 en total. El panel 
tiene otras características. 

• El error de estimación global es del 1,41% para el 
total nacional de hogares. El error por zonas geográficas 
se estima mediante las fórmulas de muestreo. Por 
ejemplo, si existieran 400 hogares en una zona, el error 
de estimación cuando se trata de medir si se consume o 
no un producto, en ella, sería aproximadamente del 5%. 

• El panel se renueva completamente cada cuatro 
años, a razón de un 25% anual, que es la rotación de 
los panelistas. 


La información se obtiene en 576 puntos de sondeo 
o localidades geográficas. 




• La captación de los panelistas se hace al azar en 
cada lugar por rutas aleatorias. 

• El control de la muestra es semanal por punto de 
sondeo. 

• El control de la muestra es mensual para los 
criterios de configuración de la muestra (edad del ama 
de casa, número de hijos, nivel socioeconómico...). 

Para obtener la información, Kantar World Panel distribuye 
entre los panelistas un diario de compras autoadministrado 
que se remite semanalmente por correo a la empresa. El 
diario de compras tiene un aspecto similar -algo 
simplificado-, para cada uno de los productos considerados, 
al que figura en el cuadro 3.10. 

t^image 

A través de la información que proporcionan estos paneles 
las empresas que compran los informes de Kantar World 
Panel consiguen, 

• Conocer de forma continua el comportamiento del 
consumidor.. 

• Tener información para reducir el riesgo en la toma de 
decisiones. 

• Conocer el comportamiento de los canales de 
distribución. 


Los informes que proporciona Kantar World Panel a sus 
clientes son de dos clases, 

Estándar, con carácter mensual, en el que se explica la 
situación del mercado, de las marcas, variedades y formatos 
con relación a las regiones geográficas, características del 
hogar y del lugar de compra. Kantar World Panel a partir de 
su panel de hogares proporciona, en concreto, información 
continuada sobre, 

• Volumen de mercado y participación de las marcas. 

• Penetración por mercados y marcas. 

• Consumo medio realizado por los consumidores. 

• Precios pagados por los consumidores. 

• Distribución del consumo por zonas geográficas. 

• Distribución del consumo por canales de venta. 

• Perfil del consumidor de cada tipo de producto y 
marcas en función de la edad, clase social, presencia de 
niños, hábitat, profesión, etc. 

• Comportamiento de las ventas en cadenas de 
distribución y grandes almacenes. 

Especiales, que proporcionan la siguiente información. 

• Superconsumidores, o clasificación de los clientes 
por sus volúmenes de compra. 

• Lanzamiento de marcas. Evolución de las marcas 
que se lanzan al mercado dentro de un intervalo 




temporal. 


• Transferencia de consumo. Crecimiento o 
decrecimiento del mercado, zonas de riesgo para las 
marcas, cambios entre marcas. 

• Fidelidad de los consumidores. Identificación de los 
perfiles de clientes fieles, ganados y perdidos, y 
volúmenes de compra de cada segmento. 

Otros servicios que ofrece Kantar World Panel son los 
siguientes. 

• Cadenas de distribución. Informes relativos a 
concentración de ventas por cadenas y seguimiento a 
corto plazo de acciones de propietarios o fabricantes de 
las marcas. 

• Category Manager. Es un servicio que se ofrece a 
fabricantes y distribuidores para que ambos puedan 
tomar decisiones y colaboran beneficiándose 
mutuamente. CAIMAN analiza el potencial de mercado 
(gasto en una cadena respecto al total gastado, tanto 
dentro como fuera de la cadena), gasto perdido (gasto 
de una categoría que los clientes de una cadena 
realizan fuera de ella) y fidelidad observada (gasto de 
una categoría que los clientes han realizado en ella). 
Estas magnitudes se miden en porcentaje. 

• Data server. Es un servicio que proporciona software 
para analizar información relativa a marketing y ventas, 
con la posibilidad de hacer cálculos y gráficos. 

• Kantar distribución. Estudia el perfil de los clientes 
de las grandes cadenas de distribución; Carrefour, Día, 



Caprabo, Alcampo, Eroski, Mercadona, Hipercor y 
Sabeco. 

• Quick Analysis. Consiste en un diagnóstico y 
soluciones para una marca con problemas en algún 
mercado. 

• Tablas de gestión, que resumen los puntos fuertes y 
débiles de cada marca. 

En el CD se expone el panel HOMESCAN de Nielsen. 
www.nielsen.com 


3.4.2.3. Sesgos de los paneles 

En los paneles de consumidores pueden aparecer sesgos. 

Las fuentes de sesgos más importantes son las siguientes, 

• Tamaño de la familia. Las personas que viven solas 
son más difícilmente localizadles y menos proclives a 
colaborar proporcionando información. En general, un 
panel debe estar constituido por personas que lleven 
una vida metódica. 

• Identificación o selección de respondientes. En los 
hogares las decisiones de consumo no son ni totalmente 
autónomas ni totalmente colectivas. La compra de 
muebles o del coche son decisiones que no toma una 
sola persona, salvo que viva sola. El carácter colectivo 
de algunas decisiones puede sesgar conclusiones sobre 
comportamiento del consumidor, puesto que tal vez se 
atribuya a personas identificadas unos 
comportamientos inducidos por un grupo, cuya 
dimensión puede ser variable. 



Edad del ama de casa. La experiencia pone de 
relieve que son las amas de casa entre 25 y 34 años las 
que mejor colaboran en la formación de los paneles. A 
partir de los 35 o 40 años las dificultades aumentan. 

Propiedad de la vivienda. Las personas que son 
propietarias de su casa colaboran mejor que aquéllas 
que viven en pisos alquilados. Es comprensible, pues un 
propietario destina una parte importante de su renta a 
su casa, y se interesa más por aquello que tenga que 
ver con la decoración del hogar. 

Sensibilidad ante el precio. Aquellas personas que 
son sensibles a los precios tienden a colaborar mejor 
que aquéllas que no se preocupan tanto por ellos. 

Renta. Los extremos del espectro no suelen colaborar. 
La clase media es la más proclive a hacerlo. 

Nivel cultural. Un panelista debe recoger información 
y cumplimentar unos impresos. En principio, cabe 
esperar que a medida que aumente el nivel cultural 
también lo haga la predisposición a participar en un 
panel. 

La naturaleza de los productos influye en la 
probabilidad de ser registrados en el panel. Aquéllos 
que son difíciles de identificar, como productos textiles 
o libros, son más fácilmente olvidables. Los productos 
de precio bajo corren el riesgo de ser subestimados por 
los panelistas, como puede suceder con alimentos 
baratos, de compra rutinaria, como el pan o la leche. Por 
el contrario, los productos nuevos y lujosos tienen 
muchas más posibilidades de no ser omitidos. 



• El tipo de compra también incide en la probabilidad 
de registro de los productos en los paneles. En general, 
los productos que se adquieren mediante procesos de 
compra planificada, como un electrodoméstico, tienen 
más posibilidades que los adquiridos de forma 
impulsiva, como las golosinas. 

La aparición de estos sesgos tiene influencias importantes. 
Obsérvese que el perfil de un panelista es de clase media, 
joven y propietario de su vivienda. Esto significa que los 
resultados de los paneles deben ser ponderados, teniendo 
en cuenta el peso de los grupos socioeconómicos que 
proporcionan la información. En todo caso se intenta que la 
muestra sea representativa y para ello se incentiva la 
colaboración de los panelistas. 

5 . 4 . 2 . 4 . Utilidad de los paneles de 
consumidores 

Los panelistas, en general, proporcionan información de 
forma continua. Para evitar su olvido la registran en un 
diario o periódico. Se registran los productos, las marcas, sus 
precios, cantidades adquiridas, tamaños de envases y lugar 
de compra en un diario de compras cuya presentación 
simplificada para un producto es la que aparece en el cuadro 
3.10. 

Un panel de consumidores proporciona los siguientes 
indicadores básicos: penetración, compra media, gasto 
medio, frecuencia de compra, precio pagado, 
establecimiento frecuentado, etc. Considerando que las 
empresas que explotan la información de los paneles poseen 
los datos de los consumidores, el cruce de las informaciones 
permite realizar, teóricamente, los estudios que se exponen 
en cuadro 3.11. 


Cuadro 3.11. Utilidad de los paneles de 

consumidores 


Estudios que se 
pueden realizar 

Información que proporciona el 
estudio a partir de los datos del 
panel 

Comportamiento del 
consumidor: los 
hábitos de compra 

• Qué se compra en el hogar 

• Quién compra 

• Cuándo se compra 

• Cuánto se compra 

• Dónde se compra 

• A qué precio de se compra 

Conocimiento de las 
ventas y de los 
mercados 

• Ventas en España 

• Ventas por regiones 

• Ventas según canales de 
distribución 

• Ventas por cadenas de 
establecimientos 

Segmentación de 
mercados 

• Por marcas 

• Por formatos 

• Por variedades 

• Por sabores 

• Por envases 

Características de los 
consumidores 

• Edad del ama de casa 

• Clase social 

• Tamaño de la familia 

• Presencia de niños 

• Clase social 

• Profesión 

• Poder adquisitivo 

• Hábitat 

Tamaño del mercado y 

• Evolución de las ventas por 
















tendencias de los 
productos 

productos 

• Evolución de las ventas 
mercados 

• Difusión de productos nuevos 

• Transferencias entre marcas 

• Predicción de éxito de 
productos nuevos 

Efectos de las políticas 
de marketing 

• Efectos de las alteraciones en 
los precios 

• Efectos de las modificaciones de 

envases 

• Fidelidad a las marcas 

• Eficacia publicitaria 

Comportamiento del 
consumidor con 
relación al 
establecimiento 

• Fidelidad al establecimiento 

• Número de establecimientos 
donde compra 

• Frecuencia de compra en el 
establecimiento 

• Importe de la compra por 
establecimientos 


Fuente: Elaboración propia. 


3.4.2.5. Grupos testigo 

Es posible que las empresas no busquen información 
permanente y siempre idéntica. En estas situaciones se 
emplean grupos testigo. Un grupo testigo en una muestra de 
consumidores que aceptan colaborar en encuestas. Con 
frecuencia son antiguos panelistas o pueden haber sido 
reclutados a través de anuncios en prensa. Se acude a ellos 
para recoger información que no tenga carácter repetitivo. 









Para la formación del grupo se aplican los principios de 
representatividad de las muestras. Los grupos pueden servir 
para realizar estudios cuantitativos o cualitativos. Con los 
grupos testigo puede suceder algo parecido a lo que ocurre 
con los paneles en lo relacionado con su duración. Las 
personas pueden abandonar. Sin embargo, son fáciles de 
constituir, permiten hacer estudios dignamente fiables y su 
coste es ventajoso frente a otras alternativas. 

3.4.2.6. Valoración de los paneles de 
consumidores 

Finalmente, es necesario hacer una valoración de los 
paneles de consumidores. Por una parte, y además de la 
utilidad que proporcionan de acuerdo con los estudios que 
se pueden hacer, se puede añadir que la información que se 
recoge en el diario tiene carácter objetivo, porque no surgen 
los sesgos que puedan introducir los encuestadores o 
entrevistadores. 

Entre los inconvenientes se encuentran los siguientes, 

• Resultan muy caros, motivo que hace que sólo 
institutos o instituciones grandes pueden soportar su 
coste. 

• Los paneles se degradan con el paso del tiempo. Los 
panelistas abandonan, porque se aburren o porque 
cambian sus condiciones. En un panel de madres con 
hijos menores de 2 años, la duración de una panelista 
se limita, obviamente, a dos años. Esto obliga a que los 
paneles deban ser renovados periódicamente para que 
sigan siendo representativos. 

• Sólo proporcionan información cuantitativa; no 

permiten conocer creencias, opiniones, preferencias. 



motivaciones, actitudes, etc. 


• Pueden proporcionar una información sesgada, pues 
las familias jóvenes, con niveles de renta y cultura 
medios o altos son los grupos más proclives a 
proporcionar información. 


3.5. PANELES DE DETALLISTAS 

3.5.1. Concepto y utilidad 

Las empresas que producen bienes los distribuyen en 
multitud de establecimientos comerciales. Los productos 
que salen de una factoría no están, necesariamente, 
vendidos. Pueden permanecer en almacenes de mayoristas 
o minoristas, o en establecimientos comerciales a la espera 
de ser vendidos. Un panel de detallistas es, en definitiva, 
una muestra permanente representativa de 
establecimientos a partir de la cual las empresas pueden 
conocer la difusión de sus productos, rotaciones, valor de 
sus existencias, etc. El panel se forma porque, 

• Las empresas necesitan conocer sus ventas, la 
rotación de sus productos, la penetración de sus marcas 
en los mercados y sus cuotas de participación, o los 
tipos de establecimientos donde venden. 

• Es necesario hacer una valoración de existencias 

iniciales y finales en cada período de referencia. Las 
empresas no pueden valorar las existencias que se 
encuentran repartidas en multitud de establecimientos 
o almacenes, pues desconocen su número, 
características y localización. 



• Las empresas necesitan información con carácter 
periódico. Si los objetivos de información reseñados 
fueran esporádicos tal vez las empresas pudieran 
conseguirlos por su cuenta. Sin embargo, estas 
necesidades de datos son muy frecuentes, su volumen 
es considerable y tienen que conseguirla con mucha 
frecuencia 

3.5.2. Los paneles Nielsen 

Los paneles Nielsen nacieron en 1923 y estudian una gran 
variedad de productos, en diversos tipos de 
establecimientos, en una serie de áreas geográficas. Los 
productos aparecen a continuación en el cuadro 3.12. 

3.5.2.1. Tipo de productos que analizan 


Cuadro 3.12. Productos que analizan los paneles Nielsen 


Población 

Objetivo del estudio 

Tipo de establecimiento 

Área geográfica 

Alimentación 

Detallistas de alimentación 

Hiper, libreservicio, 
tiendas tradicionales 

Toda España 

Hostelería 

Detallistas que trabajen con 

5 de 9 clases de productos 
(vino, anís, brandy, ginebra, 
licor, refrescos, cerveza, 
agua mineral, vermouth) 

Bares, Pubs, Discotecas, 
Hoteles, Restaurantes, 
Consumo externo 

Toda España 

Combinado 

Establecimientos de 
droguería y perfumería 

Droguerías, perfumerías. 
Mercerías 

Toda España 

Cash & Carry 

Establecimientos 
mayoristas en libre servicio 

Cash & Carry 

Toda España 

Farmacias 

Farmacias 

Farmacias 

Toda España 

Electrodomésticos 

Detallistas de 
electrodomésticos 

Audio, video. 

Hiper 

Generales 

Pequeño electrodoméstico 

Toda España 

Fotografía 

Detallistas de fotografía 

Hiper 

Minilaboratorios 

Otras tiendas 

Toda España 

Juguetes 

Detallistas de juguetería 

Hiper 

Jugueterías 

Toda España 


Fuente: Niciscii. 


3.5.2.2. Tipo de establecimientos 


Nielsen obtiene información procedente de, 

• Hipermercados, que son establecimientos en régimen 
de autoservicio con superficie de venta superior a 2.500 


• Libreservicios, que son establecimientos en régimen de 
autoservicio de 1.000 a 2.499 m^; de 400 a 999 m^; de 
100 a 399 m^ y menor de 100 m^. 















Tiendas tradicionales, sin autoservicio. 




• Establecimientos marginales de alimentación. Son 
establecimientos no clasificados anteriormente que 
venden alguno de los siguientes productos. 

• Marginales Tipo I; panaderías y lecherías. 

• Marginales Tipo II; carnicerías y charcuterías. 

Las áreas geográficas que Nielsen tiene en cuenta es sus 
estudios se configuran teniendo en cuenta parámetros de 
población y otros socieconómicos; volumen de población, 
superficie de la zona geográfica, número de hogares y su 
composición, renta, consumo, e índices de capacidad de 
compra de productos de uso común (ICCl), de tipo medio 
(ICC2) y especializados (ICC3). Estas áreas aparecen en el 
cuadro 3.12. 


Cuadro 3.12. Áreas geográficas Nielsen 


Área 1 
Cataluña, 
Aragón, 
Baleares y 
Barcelona 
Metropolitana 

Área 2 
Centro Este 

Área 3 

Sur 

Área 4 
Centro y 
Madrid 

Metropolitana 

Área 5 
Noroeste 

Área 6 
Norte 
Centro 

Baleares 

Albacete 

Almería 

Ávila 

Asturias 

Álava 

Barcelona 

metropolitana 

Alicante 

Badajoz 

Cáceres 

La Coruña 

Burgos 

Barcelona no 
metropolitana 

Castellón 

Cádiz 

Ciudad real 

León 

Cantabria 

Gerona 

Murcia 

Córdoba 

Cuenca 

Lugo 

Guipúzcoa 

Huesca 

Valencia 

Granada 

Guadalajara 

Orense 

La Rioja 

Lérida 


Huelva 

Madrid 

metropolitana 

Pontevedra 

Navarra 

Tarragona 


Jaén 

Madrid no 
metropolitana 


Falencia 

Zaragoza 


Málaga 

Salamanca 


Vizcaya 



Sevilla 

Segovia 






Soria 






Teruel 






Toledo 






Zamora 






Valladolid 




Fuente: Niclscn. 


3.5.2.3. Selección de establecimientos 

Para formar un panel de Alimentación Cash & Carry 
Nielsen tiene identificados 14.000 establecimientos con la 
siguiente información (Fernández Nogales, 1997, pág. 100) 

• Selección de establecimientos; nombre, dirección, 
antigüedad, tipo, etc. 

• Potencial teórico de ventas. 

• Equipamiento comercial; superficie, cajas, personas, 
escáneres, etc. 























• Secciones abiertas; carnicería, pescaderías, frutería, 
textil, bazar, etc. 

Para seleccionar los establecimientos se aplica muestreo 
estratificado con cuotas proporcionales al volumen de 
población, número de establecimientos y sus clases. Los 
establecimientos que colaboran reciben regalos, formación o 
información procedente de los paneles con los que 
colaboran. 

5 . 5 . 2 . 4 . Operativa del panel e Información que 
proporciona 

Una vez seleccionada la muestra de establecimientos el 
instituto investigador se pone en contacto con ellos para 
solicitar su colaboración y permitirle que se le deje tomar la 
información que solicite. 

La fórmula que se emplea para conocer las ventas es de 
contabilidad elemental. 

E¡ + Compras = Ventas + Ef 

Es decir, las existencias iniciales más las compras son 
iguales a las ventas más las existencias finales. Lo que había 
más lo que se compró es igual a lo que se ha vendido más lo 
que queda. Para conocer las ventas basta despejar su valor 
en la ecuación. 

El potencial de información que puede proporcionar un 
panel de detallistas es muy grande. 

• Identificación del producto: marca, tamaño y tipo 
de envase. Por ejemplo Coca Cola sin cafeína en lata de 
330 cc. 



Ventas al consumidor en valor en términos 
monetarios absolutos y en cuota de mercado. Por 
ejemplo, Coca Cola podría haber vendido 1.000.000 de 
€. de Coca Cola Light en el Área Metropolitana de 
Madrid. Ello podría suponer un 85% de las ventas de 
refrescos bajos en calorías. 

Ventas en unidades físicas en términos absolutos y 
relativos. El volumen de ventas del mencionado 
producto fue de 40.000.000 de latas de 330 cc., y en 
términos relativos un 68,54%. 

Compras efectuadas por detallistas en volumen. 
Por ejemplo, 43.567.890 latas de 330 cc. 

Existencias iniciales y finales. Las iniciales fueron, por 
ejemplo 2.345.546. Si se conocieran las ventas, pero no 
las existencias finales, su estimación es sencilla, 

2.345.546 + 43.567.890 = 40.000.000 + Ef 
Ef = 5.913.436 unidades. 

Duración de los stocks suponiendo un ritmo de 
consumo como el actual. Si se consumen 40.000.000 de 
latas al mes y quedan 5.913.436 un sencilla regla de 
tres pone de relieve que las existencias se agotarán 
dentro de cinco días aproximadamente. 

Porcentaje de establecimientos que ha 
trabajado con el producto. Por ejemplo, un 67%. Ese 
peso se puede expresar en porcentaje sobre ventas. Se 
podría decir que las ventas de Coca Cola Light en 
tiendas tradicionales, en euros, han supuesto un 2,34% 
del total. 



• Porcentaje de establecimientos que no tenían 
existencias en el momento de recoger la información. 

• Porcentaje de establecimientos que se 
suministraron del producto durante el período del 
estudio. 

• Stock medio del producto y ventas medias por tipo de 
establecimiento y por zona. 

• Precio medio unitario del producto por tipo de 
establecimiento y por zona. 

• Cuota de mercado en la zona y respecto a otros 
mercados, incluido el total. 

• Promociones desarrolladas durante el período de 
estudio y su descripción; rebaja en el precio, sorteos, 
regalos, cantidad de producto gratis, etc. También debe 
hacerse una descripción del tipo de establecimiento y 
de la promoción que en él se hace. 


3.6. PANELES DE AUDIENCIAS 


Las empresas necesitan diseñar campañas de 
comunicación eficaces. Esto significa que deben impactar al 
mayor número de personas de su población objetivo con el 
menor coste posible. Un fabricante de coches muy caros 
nunca se anunciaría en TV. Pagaría demasiado para llegar a 
su población objetivo. Sus mensajes se «desperdiciarían», 
no interesarían a la mayoría de la población. Sin embargo, 
podría insertar sus anuncios en una revista pensada para un 
segmento de población con renta elevada, comprador 
potencial de ese tipo de automóvil. 



Las empresas conocen de sobra estas ¡deas, pero no 
suelen ser capaces de desarrollar campañas de 
comunicación y simultáneamente comprobar las audiencias 
y sus perfiles. Las agencias publicitarias necesitan conocer 
las audiencias de los medios de difusión o los lectores de 
prensa. A partir de esas informaciones se pueden diseñar 
campañas de comunicación con muchas posibilidades de ser 
eficaces. 

Las empresas más significativas relacionadas con el 
estudio de audiencias son Kantar, www.kantarmedia.es , y la 
Asociación para la Investigación de Medios de 
Comunicación, www.aimc.es . En los próximos apartados se 
resume la información que estas organizaciones ofrecen en 
sus páginas web respectivas. Consúltelas para acceder a 
información actualizada en sus web. 

3.6.1. El panel Kantar Media 

La empresa Kantar ofrece diversos productos relacionados 
con los controles de audiencias de televisión y la aparición 
de noticias e imágenes de las empresas, sus productos o 
marcas. Estos datos son de gran interés para las empresas 
que contratan esos servicios, para la industria televisiva y 
también para las empresas dedicadas a actividades 
publicitarias. Los productos que Kantar ofrece son los 
siguientes. 

• Audiencia de Medios, que mide y controla la 
audiencia en TV, y realiza seguimientos de publicidad y 
programaciones. 

• Clipping realiza seguimientos, a través de 
documentalistas, de noticias de empresas, de sus 
productos o marcas o noticias en general, en medios de 




comunicación diversos. Busca la información en más de 
140 cabeceras de periódicos, unas 250 revistas y en las 
principales emisoras de radio y televisión. 

• Patrocinio ofrece estudios de patrocinio deportivo en 
los medios de comunicación. Analiza la presencia de 
marcas y logos en eventos deportivos emitidos o 
publicados en los diferentes medios de comunicación. 

3.6.1.1. Panel de audiencias. Características 

El panel de audiencia de televisión está formado por una 
muestra de hogares representativos de la población y que 
poseen audímetros, que son unos aparatos conectados a los 
televisores que sirven para registrar la información de los 
comportamientos de los panelistas. El panel general lo forma 
una muestra de la población de más de cuatro años de 
edad que reside en la Península e Islas. Este panel está 
formado, a su vez, por otros nueve paneles correspondientes 
a Andalucía, Cataluña, País Vasco, Galicia, Madrid, 
Comunidad Valenciana, Castilla La Mancha, Canarias y Resto 
de Península y Baleares. 

La población para diseñar el panel se define a partir de 
fuentes estadísticas y demográficas, como INE, Estudio 
General de Medios y organismos de las Comunidades 
Autónomas. Con esta información es posible determinar los 
tamaños de las muestras y los criterios de 
estratificación basados en la distribución geográfica de la 
población, el equipamiento doméstico, las actividades que 
realizan las personas, nivel socioeconómico de los hogares, 
etc. El panel lo forman hogares principales, no viviendas 
secundarias, con televisión, que residen en la Península e 
Islas y todas las personas que tengan más de cuatro años 
que vivan en ellas. 



La muestra es aproporcional, es decir, se ha 
sobredimensionado para que tenga tamaño suficiente en 
zonas donde aplicando criterios de afijación proporcional se 
obtendrían muestras pequeñas que impiden la inferencia de 
resultados. La composición geográfica de la muestra del 
panel aparece en el cuadro 3.13. 


Cuadro 3.13. Tamaño de las muestras del Panel de 

Audimetría 

AÑO 2010 



[hogares 

INDIVIDUOS 

España 

4.625 

12.099 

Andalucía 

530 

1.421 

Cataluña 

530 

1.356 

Madrid 

430 

1.198 

Resto 

175 

424 

Comunidad Valenciana 

380 

1.022 

Galicia 

350 

912 

País Vasco 

350 

868 

Canarias 

350 

1.003 

Castilla-La Mancha 

350 

947 

Murcia 

220 

654 

Aragón 

220 

537 

Asturias 

220 

525 

Castilla y León 

300 

751 

Baleares 

220 

606 


Fuente: TNS. 
























Para que las personas puedan proporcionar información se 
emplean unos aparatos llamados audímetros que controlan 
la actividad del televisor, vídeo, sintonizador de satélites, 
descodificador analógico o digitales, etc. El número de 
audímetros es de 4.625 aparatos instalados. El audímetro 
registra los siguientes estados y funciones. 

• Aparato encendido o apagado 

• El canal o emisora sintonizada 

• Conexión del teletexto y otras entradas auxiliares 

• Si el aparato de vídeo graba o reproduce 

El audímetro se maneja con un mando a distancia. Cada 
persona del hogar tiene asignada una letra en un botón, que 
sirve para conectar o apagar el televisor. También se puede 
registrar la audiencia de invitados, e incluso su edad y 
género, mediante teclas auxiliares. 

El audímetro puede recoger otras informaciones, como 
ausencias prolongadas, visión de cintas grabadas de señales 
de TV para ser reproducidas con posterioridad al momento 
de la emisión (audiencia recuperada). La información del 
audímetro se registra durante las 24 horas del día y se 
vuelca de madrugada, por línea telefónica, a los 
ordenadores de Kantar Media. 

El audímetro no es capaz de identificar el contenido de las 
emisiones. Detecta las emisoras y las franjas horarias de 
recepción de las señales. Para conocer los contenidos existe 

el Departamento de Minutado y Control de 
Programas e Inserciones Publicitarias, que se encarga 
de registrar los programas y anuncios emitidos por las 
cadenas controladas; unos 5.500 anuncios y 3.200 
programas diarios, aproximadamente. El departamento 
central se localiza en Madrid y los demás en Barcelona, 



Valencia, Sevilla, Bilbao, La Coruña, Santa Cruz de Tenerife y 
Toledo y controla 50 cadenas de TV. 

3.6.1.2. Información que proporciona el panel 
de audiencias de TV 

La tabla que aparece a continuación muestra las cuotas de 
audiencia de una serie de cadenas de TV el 5 de febrero de 
2002 en determinadas franjas horarias. Los datos que 
aparecen en el cuadro 3.14 miden la audiencia y la cuota de 
cada cadena. Estos resultados también se muestran el 
gráfico que figura tras él. Los ejemplos son algo antiguos 
pero ilustrativos. 


Cuadro 3.14. Agrupaciones horarias 


Agrupaciones horarias: Península, Baleares y Canarias, Martes 05/02/02 
Público Objetivo: Total Personas: Universo (000): 39280; Muestra Teórica: 9763. 


TTV TVE1 La 2 T5 A A3 A C+ A AUT DIG LOC OTR 


Total Día 

A. Acu: 

82.6 

63.3 

53.1 

59.7 

64.2 

19.2 

53.4 

6.3 

21.5 

5.1 

(02:30-26:30) 

Cuota: 


22.3 

9.4 

18.7 

22.0 

2.0 

19.4 

3.3 

1.7 

1.2 

Madrugada 

A. Acu: 

6.1 

3.2 

1.3 

1.9 

1.0 

0.2 

1.5 

0.4 

0.8 

0.2 

(02:30-07:00) 

Cuota: 


28.5 

10.6 

21.1 

10.1 

0.9 

13.9 

7.4 

4.5 

3.0 

Mañana 

A. Acu: 

35.1 

17.0 

10.1 

15.2 

13.7 

2.6 

12.2 

1.8 

2.3 

1.0 

(07:00-14:00) 

Cuota: 


24.4 

12.4 

23.5 

15.1 

2.0 

15.0 

4.8 

1.4 

1.4 

Sobremesa 

A. Acu: 

53.4 

28.6 

16.7 

24.3 

27.1 

9.8 

22.7 

2.6 

4.9 

2.0 

(14:00-17:00) 

Cuota: 


23.1 

9.4 

18.7 

21.1 

3.7 

19.3 

2.6 

1.1 

1.0 

Tarde 

A. Acu: 

47.8 

25.4 

12.4 

18.7 

27.0 

2.9 

22.4 

2.9 

5.6 

1.9 

(17:00-20:30) 

Cuota: 


27.5 

4.7 

13.1 

27.4 

1.0 

20.4 

3.6 

1.1 

1.2 

Noche 1 

A. Acu: 

67.9 

45.7 

36.9 

41.5 

45.3 

9.4 

38.7 

4.3 

13.6 

3.5 

(20:30-24:00) 

Cuota: 


19.0 

12.0 

18.2 

20.9 

1.9 

21.5 

2.9 

2.3 

1.3 

Noche 2 

A. Acu: 

31.8 

15.6 

7.8 

17.6 

17.7 

1.0 

11.7 

1.8 

3.8 

1.1 

(24:00-26:30) 

Cuota: 


17.6 

6.0 

27.9 

25.8 

1.1 

15.8 

3.0 

1.9 

0.9 


Fílenle: \v\v w.sofrcsam.com 


La información que aparece en el cuadro muestra las 
audiencias acumuladas y las cuotas de pantalla de diversas 
cadenas de televisión en total y también por franjas 
horarias; de madrugada, por la mañana, sobremesa, por la 
tarde, por la noche antes de las 12 y desde las 12 hasta las 





2:30. Se observa que TVl tiene una cuota de pantalla o 
shareóe\ 22,3%. Esto significa que el 22,3% de las personas 
que este día vieron la televisión habían sintonizado TVl. En 
la franja de sobremesa la cuota asciende a 23,1%. La 
información que proporciona esta tabla es muy importante, 
tanto para las empresas anunciantes como para las 
publicistas. Las tarifas de los anuncios varían según la 
audiencia y franja horaria. La tabla también permite estimar 
el volumen de personas que serán alcanzados por los 
anuncios según cadenas y agrupaciones horarias. 

El gráfico 3.2 muestra con mucha claridad las cuotas de 
pantallas de diversas cadenas en distintas franjas horarias. 

Gráfico 3.2. 

Fuente de información cuantitativa 



El cuadro 3.15 muestra la evolución de la audiencia 
minuto a minuto acumulada y las cuotas de pantalla (CTA) 
de una serie de cadenas. 















































































Cuadro 3.15. Evolución de la audiencia minuto a minuto 


Minuto a Minuto: Península, Baleares y Canarias, Martes 05/02/02 

Público Objetivo: Total Personas: Universo (000): 39280; Muestra Teórica: 9763. 


TTV TV1 La 2 T5 A3 C+ AUT DIG 

AM% AM% Cta AM% Cta AM% Cta AM% Cta AM% Cta AM% Cta AM% Cta 


20:30 

29.3 

10.0 

34.2 

0.9 

2.9 

3.5 

11.8 

7.7 

26.4 

0.8 

2.7 

4.8 

16.5 

1.0 

3.3 

20:31 

29.5 

10.1 

34.4 

0.9 

2.9 

3.7 

12.7 

7.6 

25.8 

0.6 

2.1 

4.9 

16.5 

0.9 

3.2 

20:32 

29.5 

9.6 

32.5 

1.0 

3.3 

4.1 

14.0 

7.5 

25.5 

0.6 

2.0 

4.9 

16.6 

1.0 

3.2 

20:33 

29.6 

8.4 

28.4 

1.3 

4.3 

4.3 

14.5 

8.0 

27.2 

0.6 

2.0 

5.1 

17.2 

1.0 

3.4 

20:34 

29.9 

8.2 

27.3 

1.3 

4.4 

4.4 

14.9 

8.2 

27.5 

0.7 

2.4 

5.2 

17.3 

1.0 

3.2 

20:35 

30.0 

8.1 

27.0 

1.2 

4.1 

4.6 

15.2 

8.2 

27.4 

0.7 

2.5 

5.2 

17.3 

0.9 

3.1 

20:36 

30.3 

8.2 

26.9 

1.2 

4.1 

4.6 

15.1 

8.1 

26.8 

0.7 

2.3 

5.6 

18.4 

0.9 

3.0 

20:37 

30.5 

8.3 

27.3 

1.5 

4.8 

5.0 

16.3 

7.1 

23.2 

0.7 

2.4 

5.9 

19.4 

0.9 

3.1 

20:38 

30.7 

8.4 

27.4 

1.5 

5.0 

5.3 

17.3 

6.5 

21.1 

0.9 

2.8 

6.1 

19.8 

1.0 

3.1 

20:39 

31.0 

8.8 

28.3 

1.5 

4.7 

5.5 

17.9 

6.2 

20.1 

0.9 

2.9 

6.2 

20.0 

1.0 

3.1 

20:40 

31.2 

9.4 

30.0 

1.5 

4.7 

5.5 

17.7 

6.1 

19.5 

0.9 

2.9 

6.0 

19.4 

1.0 

3.1 

20:41 

31.3 

9.4 

30.0 

1.6 

5.0 

5.6 

17.9 

6.2 

19.9 

0.8 

2.6 

5.8 

18.7 

0.9 

3.0 

20:42 

31.3 

9.7 

31.0 

1.5 

4.8 

5.6 

18.1 

6.3 

20.1 

0.7 

2.3 

5.7 

18.1 

1.0 

3.1 

20:43 

31.4 

9.9 

31.4 

1.5 

4.8 

5.4 

17.3 

6.3 

20.2 

0.7 

2.1 

5.8 

18.4 

1.0 

3.1 

20:44 

31.4 

10.0 

31.8 

1.4 

4.5 

5.4 

17.0 

6.5 

20.7 

0.6 

1.8 

5.8 

18.5 

1.0 

3.0 

20:45 

31.7 

10.0 

31.6 

1.2 

3.7 

5.4 

17.2 

6.7 

21.3 

0.7 

2.1 

5.9 

18.6 

1.0 

3.0 

20:46 

31.7 

10.2 

32.0 

1.1 

3.5 

4.4 

14.0 

7.6 

24.0 

0.7 

2.2 

6.1 

19.1 

0.9 

3.0 

20:47 

31.9 

10.2 

32.0 

1.2 

3.7 

4.1 

12.8 

8.0 

25.1 

0.8 

2.4 

6.0 

18.9 

0.9 

2.9 

20:48 

32.1 

10.2 

31.9 

1.1 

3.5 

3.9 

12.1 

8.3 

25.9 

0.8 

2.6 

6.1 

19.1 

0.9 

2.9 

20:49 

32.3 

10.4 

32.1 

1.2 

3.7 

3.8 

11.7 

8.5 

26.5 

0.8 

2.4 

5.9 

18.4 

0.9 

2.9 


/ nenie: www, solrcsam.com 

El cuadro 3.16 muestra un informe de programas y sus 
audiencias. El dato importante es la cuota de pantalla 
referida a un momento del tiempo. Por ejemplo, telediario 2 
estaba siendo visto por el 27,10% (cuota de pantalla o 
sharé) de las personas que en ese momento, a las 20:58 pm 
del día 5 de febrero de 2002 tenían conectada la televisión. 
La audiencia media fue del 10,30% y la acumulada del 
23,1%. El CD contiene información actualizada para 2010, 
con ejemplos que figuran en la web de Kantar Media, 
www.kantarmedia.com. 






Cuadro 3.16. Informe de programas y sus audiencias 


Informe de Programas: Península, Baleares y Canarias, Martes 05/02/02, 
TVE1, Todas las emisiones 


Público Objetivo: Total Personas; Universo (000): 39280; Muestra Teórica: 9763. 


Nombre Programa 

Niv 

H. Inicio 

Durac. 

A. Med. 

Cuota 

A. Acu 

D. REG (GENTE) 

/ (PBC. 8) 

P 

20:00:09 

57:51 

9.0 

30.6 

20.0 

D. REG (AVANCE PROGRAM) / (PBC, 8) (CUÉNTAME) 

S 

20:33:56 

0:36 

8.2 

27.3 

8.2 

D. REG (AVANCE PROGRAM) / (PBC. 8) NUESTRO CINE: 

S 

20:37:22 

0:18 

8.3 

27.3 

8.3 

TELEDIARIO 2 


P 

20:58:00 

48:53 

10.3 

27.1 

23.1 

PUBLICIDAD 

/ NO SOLAPADA 

S 

21:33:51 

0:10 

10.5 

25.9 

10.5 

D. REGIONAL (PBC) 


P 

21:46:53 

2:10 

6.9 

16.1 

7.2 

AVANCE PROGRAMACIÓN 

/ALA...DINA! 

P 

21:49:03 

0:45 

6.8 

15.8 

6.8 

D. REGIONAL (PBC) 


P 

21:49:48 

6:25 

6.1 

14.1 

7.7 

AVANCE PROGRAMACIÓN 

/ LA PELÍCULA DE LA SE 

P 

21:56:13 

0:24 

6.1 

13.8 

6.1 

D. REGIONAL (PBC) 


P 

21:56:37 

0:25 

6.2 

14.0 

6.2 

D. REG (EL TIEMPO 2) 

/(PBC, 8) 

P 

21:57:02 

6:58 

7.0 

15.6 

9.0 

D. REGIONAL (PBC) 


P 

22:04:00 

0:10 

5.6 

12.3 

5.6 

AVANCE PROGRAMACIÓN 

/ALA... DIN A! 

P 

22:04:10 

0:10 

5.6 

12.3 

5.6 

ALA...DINA! 

/ EL RETO DE DINA 

P 

22:04:20 

67:50 

6.2 

13.6 

24.0 

CORTINILLA 


s 

22:17:25 

0:06 

7.1 

15.1 

7.1 

PUBLICIDAD 

/ NO SOLAPADA 

s 

22:17:31 

1:20 

5.2 

11.1 

5.2 

(P) TVE CON EL CINE 


s 

22:18:51 

0:50 

5.4 

11.6 

5.4 

AVANCE PROGRAMACIÓN 

/ NUESTRO CINE; PÍDELE 

s 

22:22:36 

0:14 

5.2 

11.1 

5.2 

AVANCE PROGRAMACIÓN 

/CUÉNTAME 

s 

22:24:42 

0:45 

5.1 

11.0 

5.1 

CORTINILUV 


s 

22:25:47 

0:13 

5.0 

10.8 

5.0 


I'uaue: www.sotcsam.com 


El cuadro 3.17 muestra información sobre anuncios 
emitidos en TVl el 5 de febrero de 2002 con indicación de la 
hora de inicio, duración, código de tarifa y coste en miles de 
euros. 





Cuadro 3.17. Informe de anuncios 


Informe de Anuncios: Península, Baleares y Canarias, Martes 05/02/02, TVE1 


Público Objetivo: Total Personas; Universo (000): 39280; Muestra Teórica: 9763. 


Nombre Anuncio 

Tipo H. Inicio Dur. 

Tarifa 

P/B1 

P/B2 

P/B3 

Grp. 

Miles Coste' 

GRANJA S.FCO/MIEL 

A6 

11:14:31 

10 

49 

01/06 

04/12 

01/08 

1.4 

555 

0.9 

IDEACASA/BATERlA COCINA 

A6 

11:14:41 

30 

121 

02/06 

05/12 

02/08 

1.4 

555 

2.2 

ARTIACH/OREO B.CHOCOL 

A6 

11:15:11 

25 

105 

03/06 

06/12 

03/08 

1.4 

564 

1.9 

GALER.COL./BOHE. CLASIC 

A6 

11:15:36 

45 

180 

04/06 

07/12 

04/08 

1.4 

564 

3.2 

ABDOMATIC/SUPER REDUC. 

A6 

11:16:21 

60 

227 

05/06 

08/12 

05/08 

1.4 

567 

4.0 

DODOT/ETAPAS PLUS 

A6 

11:17:21 

30 

126 

06/06 

09/12 

06/08 

1.4 

569 

2.2 

G. BLANCA/PLATOS PASTA 

A6 

11:18:41 

20 

84 

01/02 

11/12 

07/08 

1.4 

554 

1.5 

LA CUENTA AHORA/CRED. 

A6 

11:19:01 

20 

84 

02/02 

12/12 

08/08 

1.4 

565 

1.5 

LA CUENTA AHORA/CRED. 

A6 

11:53:46 

20 

84 

01/05 

03/09 

01/05 

1.3 

522 

1.6 

GALERÍA COLEC./ARCOIR 

A6 

11:54:06 

45 

180 

02/05 

04/09 

02/05 

1.3 

511 

3.5 

COFIDIS/CRÉDITOS 

A6 

11:54:51 

20 

84 

03/05 

05/09 

03/05 

1.3 

511 

1.6 

TITÁN/SARTÉN O GRASAS 

A6 

11:55:11 

60 

227 

04/05 

06/09 

04/05 

1.3 

504 

4.5 

COFIDIS/DIRECT-CASH 

A6 

11:56:11 

20 

84 

05/05 

07/09 

05/05 

1.3 

507 

1.7 

R. CASA MONEDA/COLECCI. 

A5 

13:04:39 

52 

97 

01/01 

01/01 

01/01 

2.2 

863 

1.1 

LO MÓNACO/NATURA/COLC. 

A5 

13:32:39 

15 

225 

01/01 

01/02 

01/02 

3.3 

1287 

1.7 

LO MÓNACO/NATURA/COLC. 

A9 

13:32:54 

45 

641 

01/01 

02/02 

02/02 

3.3 

1287 

5.0 

LO MÓNACO/NATURA/COLC. 

A5 

13:38:00 

14 

300 

01/01 

01/01 

01/01 

3.1 

1211 

2.5 

DERMOESTE/CORPORACIÓN 

A9 

14:42:29 

116 

288 

01/01 

01/01 

01/01 

7.0 

2764 

1.0 

MITSUBISHI/CARISMA DI 

A7 

15:30:38 

10 

502 

01/01 

01/01 

01/01 

8.5 

3350 

1.5 

MITSUBISHI/CARISMA DI 

A7 

21:33:51 

10 

816 

01/01 

01/01 

01/01 

12.0 

4718 

1.7 


Tanfas eti decenas de euros 
* Coste en Miles de euros 


Fuente: wvv w, so Irosa in.com 


A juzgar por la información del cuadro, el anuncio de miel 
de la Granja San Francisco comenzó a las 11:14:31, duró 10 
segundos, se aplicó la tarifa 49 y costó 900 euros. 


3.6.1.3. Informes que proporciona Kantar 
Media 


Informes sobre noticias en prensa 

Kantar Media hace seguimientos de noticias sobre sus 
clientes en 140 periódicos y 250 revistas nacionales, 
autonómicas y locales. Este seguimiento se hace conforme a 
tres varios criterios, 

• Nominal; noticias que citan el nombre de una empresa, 
institución persona o evento. 





• Temática; noticias que hacen referencia al sector de la 
empresa o institución seleccionada. 

• Temática sectorial; se recogen las noticias más 
relevantes de un sector en los periódicos de mayor 
difusión. 

Las noticias son copias de lo que aparece e incluyen 
nombre del medio, fecha, número de página, sección, OJD y 
huella o mapa de la página donde aparece la noticia. Estas 
informaciones se entregan a los clientes a través de la web 
de Kantar Media, ficheros FTP, Fax, e-mail o impresas en 
papel. También se crean CD-ROM que permiten acceder a las 
noticias por fechas, cabeceras, titulares y temas. 

Informes sobre noticias en la Radio y Televisión 

Kantar Media también hace seguimiento de noticias en la 
radio y televisión. Ofrece a los clientes guiones completos o 
selecciones. Los entrega a través de la web o correo 
electrónico en forma de ficheros vaw o AVI, que ocupan poco 
espacio. Es posible la transcripción completa en papel o en 
cinta. Las emisores escuchadas son RNl, RN5, SER, COPE, 
ONDA CERO, INTERECONOMIA, TELEMADRID, CATALUÑA 
RADIO, ONDA RAMBLA y RADIO EUSKADI y las cadenas de 
televisión son; TVl, TV2, TELE 5, A3, CANAL -K, 

TELEMADRID, CANAL SUR, CANAL 2, TV3, K3-33, ETBl. 
ETB2, PUNT2, BTVy CITYTV. 

3.6.1.4. Análisis de la información 

Kantar Media cuenta con un Departamento de Análisis de 
Información que presenta sus informes en los siguientes 
términos. 



• Número de referencias en prensa, radio y televisión 
relacionadas con las marcas o productos analizados. 

• Impacto de audiencias en prensa, medida por el 
acumulado de lectores de cada referencia a partir de 
datos del Estudio General de Medios. 

• Impacto de la difusión de prensa a partir de la OJD. 

• Impacto de audiencia de televisión, medido por el 
acumulado de espectadores de cada inserción. 

• Número de titulares; noticias que citan en el titular 
el objeto de análisis (una marca, producto, 
acontecimiento, organización). 

• Valoración económica en prensa, radio y televisión 
de los espacios o tiempo de información según las 
tarifas publicitarias. 

• Número de titulares o fotos en prensa o noticias 
referente al objeto del análisis. 

• Espacios dedicados en prensa al objeto del análisis. 

• Duración de las informaciones en radio y 
televisión. 

3.6.1.5. Controles externos de Kantar Media 

Las consecuencias del uso de los datos que proporciona 
TNS son trascendentes y gracias ellos se pueden tomar 
decisiones importantes. Con información errónea se pueden 
tomar decisiones con consecuencias dramáticas. TNS ha 
adoptado mecanismos de control que garantizan la calidad y 



fiabilidad de los datos. Cuenta para ello con los siguientes 
mecanismos. 

• El Comité de Usuarios y el Consejo de Control 

son dos organismos externos que representan a todos 
los usuarios de audiometría por sectores; televisiones, 
centrales de medios, anunciantes y agencias eligen a 
los miembros que han de participar en estos 
organismos. 

• La Asociación para Investigación de Medios de 
Comunicación (AIMC), que es un organismo que 
controla de forma permanente y rigurosa la información 
de Kantar. 

• Los estudios Coincidental Interno y Coincidental 
Externo, desarrollados con carácter anual, sirven para 
medir el grado de coincidencia entre los datos 
obtenidos por estos estudios y los estimados por Kantar 
Media. 

3.6.2. El Estudio General de Medios 

En 1988 se creó la Asociación para la investigación de 
Medios de Comunicación, cuyo objetivo es la investigación 
de audiencias de los diferentes medios de comunicación, y 
la distribución de informes entre sus asociados, que son 
empresas implicadas en el sector de la comunicación, para 
garantizar la calidad, transparencia y utilidad de los datos 
estimados. La empresa se encuentra organizada en dos 
estamentos. El Estamento 1 agrupa a los anunciantes y el 
Estamento 2 aglutina a los medios de comunicación. Los 
servicios que proporciona AIMC son los siguientes. Ver 
www.aimc.es. 



• El Estudio General de Medios, que ha sido el origen 
de AIMC y constituye su contribución más importante. 
Tras realizar 43.000 entrevistas al año en tres oleadas, 
cuyos resultados se dan a conocer en abril, junio y 
diciembre proporciona información muy valiosa sobre el 
consumo de medios de comunicación. 

• Control de audiometría. AIMC desarrolla la auditoría 
técnica permanente del sistema de Audiometría de 
Taylor Nelson Sofres. 

• Auditorías técnicas. AIMC realiza otros estudios de 
interés para sus asociados. 

El producto más importante de AIMC es el Estudio General 
de Medios, que tiene las siguientes características. 

• Es un estudio poblacional, que busca una 
representación de una muestra en materia de 
comportamiento de consumo de medios. 

• Es un estudio multimedia, que considera los 
comportamientos de los consumidores de diferentes 
medios; prensa, radio y televisión e Internet. 

• Tiene carácter anual, aunque la muestra se divide en 
tres partes de igual tamaño y composición. 

El CD contiene información actualizada del EGM para 
2010 . 

3.6.2.1. Características del universo y 
muestra. 

• La población de la cual se extrae la información está 
constituida por personas de 14 o más años residentes 



en la Península e Islas. La muestra anual es de 30.000 
para el EGM Multimedia, 80.000 para EGM Radio XXI, 
75.000 para EGM Prensa, 50.000 para EGM revistas y 
43.000 para el EGM TV en 2010. 

• El procedimiento de muestreo es aleatorio, 
estratificado y polietápico y los estratos se definen por 
el cruce provincia-hábitat. La afijación es proporcional 
con una ligera sobrerrepresentación de hábitats 
inferiores a 50.000 habitantes y un tamaño mínimo de 
muestra de 210 personas por provincia y año. Para 
seleccionar las unidades muéstrales se selecciona el 
hogar mediante rutas aleatorias y dentro de cada hogar 
se selecciona la persona mediante tablas de números 
aleatorios. 

• La información se obtiene mediante entrevista 
personal sobre la base de cuestionario y 
telefónicamente en la ampliación al estudio de radio, 
por el sistema CATI, sobre la base de un cuestionario 
cerrado. Las diferentes olas, tres por año, tienen lugar 
en enero-marzo la primera, abril-junio, la segunda, y 
septiembre-noviembre la tercera. 

• El trabajo de campo lo realizan institutos de 
investigación de gran prestigio, como IPSOS ECO 
CONSULTING, AC Nielsen y Kantar Media. Las 
entrevistas telefónicas para la EGM Radio XXI las realiza 
IMOP Encuestas. Un 10% de las encuestas personales 
son supervisadas directamente por AIMC en el EGM. 

• El proceso de datos lo realiza la empresa ODEC. 


En el CD figura la composición de la muestra en 2010. 



3.6.2.2. Cuestionario utiiizado 


El cuestionario contiene varias secciones con contenidos 
diversos. Son los siguientes. 

Consumo de medios; audiencias, hábitos de audiencia y 
cualificación de la audiencia. La información que AIMC 
recoge sobre los medios responde al siguiente esquema: 

• Audiencia del último período. 

• Hábitos de audiencia. 

• Cualifícación de la audiencia. 

La audiencia del último período se corresponde con la del 
último período de aparición del soporte, es decir, 

• Ayer, para Diarios, Radio y Televisión. 

• Última semana, para suplementos. Revistas 
Semanales y Cine. 

• Últimos quince días para revistas quincenales. 

• Último mes para Revistas Mensuales e Internet. 

La cualificación de la audiencia se obtiene con información 
complementaria relativa a cantidad leída, tiempo dedicado, 
lugar de escucha de la radio o de la televisión. 

• Datos de caracterización de la persona encuestada, 
esencialmente variables sociodemográficas. 

• Equipamiento del hogar, especialmente los relativos 
a medios; número de aparatos de televisión, aparatos 



de radio, vídeo, DVD, parabólica, TV por cable, etc. El 
cuadro 3.18 muestra conceptos que pueden ser 
utilizados como indicadores de status dentro de las 
clases sociales a las que puedan pertenecer los 
componentes de la muestra. 


Cuadro 3.18. Conceptos considerados para medir el equipamiento del hogar 


EQUIPAMIENTO DEL HOGAR 

Automóvil/Motocicletas 

Lavavajillas 

Aparato de DVD 

- Número 

Aspirador 

Televisor 

- Marca/Modelo 

Freidora eléctrica 

- Número 

- Año de compra 

Taladradora 

- Características 

- Nuevo/Ocasión 

Cámara de video 

- Pulgadas 

- Usuario Principal 

Cámara fotográfica 

- Teletexto 

- Radio 

Aparatos de radio 

- Formato panorámico 

Animales domésticos 

Equipo Hi-Fi/Cadena musical 

Suscripción a televisión de pago 

Segunda vivienda 

Ordenador personal 

Tipo de antena 

Frigorífico 

Video consola 

- Colectiva 

Congelador 

Reproductor portátil de MP3 

- Individual exterior 

Cocina 

Conexión a Internet 

- Individual interior (de cuernos) 

Hornos 

Equipamiento telefónico 

- Parabólica colectiva 

Microondas 

Teléfonos móviles 

- Parabólica individual 

Secadora de ropa 

Video 





Características de la vivienda 


Régimen de ocupación. 
(Propiedad/Alquiler/Otro) 

Equipamiento energético 


Superficie 

- Calefacción 


Tipo de vivienda 

- Agua caliente 



Fuente: AIMC. wwvv.aiiin.’.cs 


• Información del consumo del hogar. Mide el nivel 
de consumo de más de 40 productos de consumo 
individual y del hogar. Esta última información se 
obtiene solamente en las entrevistas en las que quien 
























































responde sea la persona responsable de las compras del 
hogar. 


Cuadro 3.19. Conceptos que miden el consumo del hogar 


CONSUMO DEL HOGAR 

Vino de mesa envasado (1 litro) 

Chocolate en tabletas 

- Pescados envasados 

Vino de mesa envasado 
(3/4 litro) 

Flanes y natillas envasadas 

Platos precocinados 
ultracongelados 

Gaseosas 

Tartas heladas y helados 

Comida preparada lista para 
consumir 

Agua mineral 

Otros postres envasados 

Potitos infantiles 

Yogures 

Mantequilla 

Alimentos envasados para 
perros/gatos (con marca) 

- Tipo Bio 

Margarina 

Ambientadores 

- Desnatados 

Mayonesa envasada 

Insecticidas 

- Líquidos 

Patatas fritas empaquetadas 

Abrillantadores de muebles 

-Otros 

Otros aperitivos empaquetados 

Limpia inodoros 

Cacao soluble 

Tomate frito envasado 

Detergente para lavadora: 

Café soluble 

Caldos (pastillas/cubitos) 

- Tradicional (maleta grande) 

Café descafeinado 

Sopas y cremas en sobre 

- Concentrado (ultra, micro) 

Infusiones envasadas 
(té, manzanilla, etc.) 

Salchichas envasadas 
(tipo frankfurt) 

- Liquido 

Cereales para el desayuno 

Patés/Foiegras 

Detergentes especiales 
(ropas delicadas) 

Pan de molde 

Congelados 

Detergentes para máquina 
lavavajillas 

Crema de cacao 

- Verduras envasadas 



Fílenle: AI NIC: www.uimc.cs 




















































Cuadro 3.20. Conceptos que miden el consumo individual 


CONSUMO INDIVIDUAL 

Refrescos de cola 

Vodka 

Cremas de manos 

Refrescos light 

Whisky 

Cremas para la cara hidratantes 

Tónicas 

Brandy/Coñac 

Cremas para la cara nutritivas 

Refrescos de fruta 
(naranja/limón) 

Anis/Anissettes/Aguardientes 

Acondicionador 

Refrescos de té o café 

Licores 

Champú con acondicionador 

Zumos naturales envasados 

Combinados 

Productos anti-caída del cabello 

Bitter (sin alcolhol) 

Snacks/patatas fritas envasadas 

Coloración no permanente 

Batidos 

Cigarrillos rubios 

Coloración o tinte permanente 

Bebidas isotónicas 

Cigarrilos negros 

Gel 0 fijador de pelo 

Vermouth 

Cigarros puros 

Espuma moldeadora 

Cerveza con alcohol 

Chocolatinas 

Laca 

Cerveza sin alcohol 

Sacarina/Edulcorantes 

Bronceadores o protectores 
solares para la cara 

Vinos finos (Jerez. Montilla, etc.) 

Analgésicos 

Bronceadores o protectores 
solares para el cuerpo 

Champán/Cava 

Complejos vitamínicos 

Productos para después del sol 

Ginebra 

Cremas anti-acné 


Ron 

Desodorante 



Fílenle: AI NIC: www.aiinc.cs 


• Estilos de vida, que sirven para evaluar los perfiles 
de las audiencias en función de sus intereses y 
comportamientos que puedan discriminar el consumo 
de medios. 


















































Cuadro 3.21. Conceptos considerados para medir el estilo de vida 


ESTILOS DE VIDA 

ECONOMÍA 

Seguro de vida 

Tarjeta de crédito 

Préstamos personales 

Seguro privado de enfermedad 

Tarjeta de cajero 
(Servired, 4B, Red 6000) 

Plan 0 fondo de pensiones. 

Plan de jubilación 

Cuenta corriente 

Tarjeta de fidelización 
(Ej., Travelclub, Tryocio) 

Uso de telebanco 
(banco por teléfono) 

Cartilla de Ahorros 

Fondo de inversión, acciones, 
bonos, obligaciones, pagarés, etc. 


Tarjeta de compra de 

Grandes Almacenes 

Préstamos hipotecarios sobre 
alguna vivienda 



Cuadro 3.21. Conceptos considerados para medir el estilo de vida (continuación) 


ESTILOS DE VIDA 

ACTIVIDADES 

Hacer footing 

Practicar otros deportes en 
equipo (fútbol, baloncesto, etc.) 

Hacer bricolaje casero 

Ir a un gimnasio 

Ir al teatro 

Controla la cantidad de calorías 
de su alimentación 

Esquiar 

Ir a un museo o exposición de 
arte 

Realización de régimen 
alimenticio 

Hacer excursiones, alpinismo, 
montañismo 

Ir a un concierto (recital) 

Comprar cupones de la ONCE 

Ciclismo (carretera o montaña) 

Ir a discoteca 

Comprar un décimo de lotería 

Jugar al tenis o squash 

Ir al fútbol 

Jugar a la lotería Primitiva/ 
Bonoloto 

Cazar 

Ir a carreras (motos/coches) 

Rellenar quinielas de fútbol 

Pescar 

Ir a algún otro espectáculo 
deportivo 

Ir a un bingo 

Motociclismo 

Cenar fuera del hogar 

Ir a un casino 

Practicar otros deportes 
individuales (golf, natación...) 

Ir a un instituto de belleza 

Jugar a las máquinas tragaperras 
con premio 

VACACIONES 



Destino 




Fílenle: AIMC: www.uimc.cs 


3.6.2.3. Algunos estudios de AIMC 
























































A continuación figuran gráficos que resunnen algunos de 
los estudios que AIMC desarrolla. Ver en el CD en fichero en 
fornnato PDF para 2010. 

Gráfico 3.3. Penetración de medios 



Fuente: www.aimc.es 


Gráfico 3.4. Evolución de la penetración 
























Fuente: www.aimc.es 


Gráfico 3.5. Perfiles de audiencias 













Fuente: www.aimc.es 















































Gráfico 3.6. Ranking de medios impresos 



Fuente: www.aimc.es 


Gráfico 3.7. Ranking de emisoras de radio 



RANKING DE EMISORAS DE RADIO 
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Fuente: www.aimc.es 


Gráfico 3.8. Ranking de cadenas de televisión 
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Fuente: www.aimc.es 


Gráfico 3.9. Conexión a Internet 



Fuente: www.aimc.es 


3.6.2.4. Utilidad de los estudios de AiMC. 


Los estudio de AIMC ofrecen grandes beneficios para 

















































• Los anunciantes, que pueden conocer mejor a sus 
consumidores tras evaluar su volumen de mercado, los 
targets o segmentos objetivo de sus productos, la 
relación entre campañas y consumo de productos. 
También se puede medir la eficacia publicitaria por su 
efecto sobre las ventas. 

• Las agencias pueden conocer los targets 
publicitarios, diseñar la estrategia de medios, la 
selección de soportes y evaluar las campañas. 

• Los medios de comunicación pueden diseñar 
estrategias de producto, basadas en el posicionamiento, 
análisis de la competencia, definir parrillas de 
programación, etc. También pueden diseñar estrategias 
de marketing publicitario como establecimiento de 
tarifas y otras estrategias comerciales de captación de 
clientes, etc. 

3.7. EVALUACIÓN DE LAS BASES 
DE DATOS Y PANELES. 
CAUSAS Y CRITERIOS 


La utilización de información secundaria procedente de 
bases de datos, paneles. Internet o directorios tiene sus 
riesgos. En el mercado existen múltiples y excelentes 
proveedores de información secundaria, pero también se 
corre el peligro de encontrar información de escasa calidad. 
Los investigadores deben valorar en la información 
secundaria, los siguientes aspectos. 

• Cantidad o suficiencia de información disponible en 
la fuente. Algunas son simples directorios o listados de 



empresas, o poco más. Otras proporcionan resúmenes 
muy completos de informaciones útiles. 

Relevancia de la información contenida en la 
fuente. Es decir, adecuación de los datos a las 
necesidades del investigador. 

Precisión de la información. Un investigador debe 
mostrar siempre algún recelo sobre la fiabilidad de los 
datos que maneja. Debe prestar especial atención a lo 
siguiente. 

1. Quién recogió los datos, aspecto que afecta a la 
calidad del proceso de obtención de la información y 
a su precisión Si aquélla procediera de un estudio de 
mercado habría que fijarse en la metodología que se 
siguió; tamaño de la muestra, su selección y 
localización, diseño de cuestionarios, técnicas de 
análisis de datos, etc. Si procediera de algún anuario 
o estadística, debería prestarse atención a quién la 
elaboró y en qué país. Todos los organismos o 
investigadores no son igualmente rigurosos y fiables. 
Algunas empresas construyen bases de datos a partir 
de información obtenida por otros investigadores. En 
general es mejor acudir a quienes obtienen la 
información directamente, porque explican su 
metodología y porque no presentan los errores de 
tratamiento de información en que pueden incurrir 
aquellos que la reconstruyen. 

2. Cuál fue el fin o la intencionalidad de la 
investigación. Los datos se recogen por alguna 
razón y ese fin puede poner en tela de juicio la 
fiabilidad de la información. Por ejemplo, unas cifras 
de desempleo en una región, condicionantes de una 



subvención comunitaria para mitigarlo, podrían ser 
sospechosas de estar infladas. 

3. Modo de obtener la información. Una investigación 
mediante encuesta telefónica a hogares hecha entre 
las doce y la una del mediodía tendría sesgos muy 
importantes en la muestra, porque las personas que 
trabajan fuera de sus casas quedan excluidas. 

4. Antigüedad de la información. Habrá que poner 
especial cuidado en la fecha de obtención de la 
información y con qué frecuencia se actualiza. 

5. Debe prestarse atención a la precisión en la 
definición de los datos. Es frecuente que la 
agregación de información la convierta en datos poco 
precisos y útiles para hacer investigaciones. Por 
ejemplo, podría encontrarse que un 40% de la 
población consume alcohol. Este dato no dice 
demasiado, porque no se puede saber cuánto se 
bebe. Puede suceder que los datos estén medidos de 
forma que no resulten útiles. Por ejemplo. El Instituto 
Nacional de Estadística publica información de gasto 
por conceptos genéricos como electrodomésticos, 
pero no tipos de aparatos concretos como televisor, 
cocina o nevera. 

6. Consistencia con otra información. Si el análisis 
de los datos que proporciona una fuente de 
información se opone a los resultados obtenidos tras 
analizar otras fuentes, o colisionan frontalmente con 
teorías u otras evidencias, dicha la fuente de 
información debería ser reconsiderada. 



3.8. LA ENCUESTA 


La encuesta es una técnica de recogida de información 
que consiste en la for mulación de unas preguntas a las 
personas que deben responderlas sobre la base de un 
cuestionario. 

3.8.1. Ventajas derivadas de uso de 
encuestas 

La utilización de encuestas representa grandes ventajas 
a los investigadores. Son las siguientes. 

• Estandarización. Quiere decir que al utilizar 
encuestas se harán las mismas preguntas a todos los 
elementos de la muestra. Esto implica homogeneidad 
de la información. Todo el mundo contesta a lo mismo, a 
las mismas preguntas. 

• Facilidad de administración, porque las encuestas 
están redactadas. El encuestador se encuentra con un 
texto que se limita a leer y no tiene que explicar ni 
interpretar nada. El encuestado, en encuestas postales, 
se limita a leer preguntas y a responderlas. 

• Facilidad de tratamiento de datos. Las encuestas 
poseen números y códigos que identifican las 
respuestas, es decir, se puede codificar la encuesta, o 
convertir a números aspectos cualitativos. Esta 
característica facilita grabar los datos en ordenadores 
para poder tratarlos posteriormente con programas 
informáticos. 



• Obtención de información adicional. Al encuestan 
a las personas en sus domicilios, o en establecimientos 
se puede conseguir información relativa a su aspecto o 
hábitat. Por ejemplo, se aprecia su nivel cultural, o de 
inteligencia, cómo es su casa, etc. 

• Posibilidad de hacer estudios parciales. Debido a 
que las encuestas poseen identificadores de las 
personas que responden, es posible hacer estudios 
imponiendo condiciones. Por ejemplo, se puede estudiar 
el comportamiento de los consumidores de café 
atendiendo a su edad, género, zona de residencia, nivel 
socioeconómico, etc. La utilización de encuestas resulta 
fundamental, para hacer estudios segmentación, 
imagen, posicionamiento, obtención de tipologías de 
consumidores, etc. 


3.8.2. Clases de encuestas: 
personales y postales 

Las encuestas personales consisten en un encuentro 
entre dos personas en el cual una de ellas obtiene 
información proporcionada por la otra sobre la base de un 
cuestionario. El encuentro puede realizarse en diversos 
lugares; en el de trabajo, en la calle, en unos grandes 
almacenes o en el domicilio de la persona encuestada. 
Generalmente se desarrolla sobre la base de un cuestionario 
estructurado o semiestructurado. Esto significa que las 
preguntas están fijadas aunque el encuestador puede 
proporcionar, también, las suyas, o adaptarlas al 
encuestado. Las encuestas personales pueden ser de varias 
clases: 



A domicilio, si el encuentro tiene lugar en la vivienda 
del encuestado. Cuando se comenzó a utilizar la 
encuesta personal, a mediados de los años 30, la 
información se obtenía en el domicilio de las personas. 
Trabajaban muy pocas mujeres, lo que significaba que 
generalmente siempre había alguien en casa. El 
teléfono estaba poco extendido y a través de él no se 
podían seleccionar muestras representativas. Hoy en 
día las cosas han cambiado. La encuesta personal en 
casa no es bien aceptada. Es una técnica costosa, que 
lleva tiempo y que se encuentra con una población 
reacia a abrir la puerta de su casa a un extraño. 

En establecimientos, cuando se obtiene información 
en tiendas, supermercados, grandes almacenes, etc. El 
cuestionario suele ser estructurado, aunque no es 
infrecuente que se deje libertad de respuesta al 
encuestado, al menos en algunas preguntas. 

Telefónica cuando la obtención de información se 
efectúa mediante una conversación por teléfono entre 
el entrevistador y la persona seleccionada, sobre la 
base de un cuestionario, generalmente estructurado. A 
veces, para mejorar el proceso se emplea un ordenador 
que facilita las tareas de recogida, control y tratamiento 
de la información. Algunas de las situaciones en las 
cuales se emplea la encuesta telefónica son las 
siguientes. 

1. Para analizar nuevos productos. Por ejemplo, se 
podría preguntar por el interés de un detergente 
nuevo, especial para quitar manchas de tinta o de 
pintura ya seca. Sirve para desarrollar test de 
concepto, medir el interés inicial que suscitan 
algunos productos. 



2. Para conocer la estructura de la población y para 
facilitar las tareas de muestreo. Permite seleccionar 
muestras en poblaciones raras o poco conocidas. 
Mediante una encuesta con una o dos preguntas 
permite definir las estructura de la población, 
seleccionar la muestra y las ponderaciones, para 
estudiarla posteriormente. Por ejemplo, se puede 
llamar por teléfono a 10.000 personas para conocer si 
tienen, o no, perro. Si 1.000 de ellas lo tuvieran se 
podría seleccionar una muestra de 300 para estudiar 
esa población de 1.000 para realizar para un estudio 
más profundo. 

3. Para llevar a cabo test de audiencia y test de 
eficacia publicitaria. Se puede llamar a una casa 
para preguntar si están viendo la televisión. Si la 
respuesta fuera afirmativa se puede solicitar 
información sobre la cadena que se está viendo. 
También es posible llamar para preguntar si se ha 
visto un determinado programa o qué anuncios se 
recuerdan. 

4. Para analizar las actitudes postcompra. Un 
fabricante de coches puede llamar por teléfono a los 
compradores recientes y preguntarles por su grado 
de satisfacción con el modelo que han adquirido. Los 
fabricantes japoneses de máquinas de fotos 
preguntan a sus clientes, cada tres meses -se supone 
que el tiempo hace al consumidor más crítico- qué 
modificaciones convendría introducir en sus 
máquinas para mejorarlas. 

Telefónica asistida, o CATI (Computer Aided Telephone 
Interview). En esta modalidad de encuesta los teléfonos 
se conectan a un ordenador, que tiene en su memoria el 
cuestionario y las características de la muestra. Los 



encuestadores llaman por teléfono, a un número 
generado por un programa. El encuestador lee el 
cuestionario que aparece en pantalla, y marca las 
respuestas directamente en el ordenador haciendo click 
con el ratón en las casillas correspondientes. 

Gráfico 3.10. Diagrama del proceso de una entrevista 

telefónica 




AEDEMO ha publicado las directrices ESOMAR sobre cómo 
debe desarrollarse la encuesta telefónica en sus 
modalidades. Son las siguientes. 

1. El encuestador debe dejar muy claro que se trata de 
una investigación, y que no trata de vender nada 





























en ese momento ni en el futuro. 


2. Debe garantizarse el anonimato de los 
respondientes. 

3. Debe informarse a los respondientes de que pueden 
verificar la garantía de la empresa 
investigadora. 

4. Debe darse una explicación clara y convincente 

de por qué se está llamando a la persona. 

5. Las llamadas se harán a horas razonables. 
Generalmente entre las 14 y las 16 o entre las 20 y 
las 22 horas. Fuera de este horario, las personas 
pueden estar ausentes. Más tarde de las 22 
posiblemente estén descansando. 

• Finalmente, existen unas encuestas personales 
llamadas ómnibus. Consiste en una variedad de 
encuesta realizada por un instituto que la realiza 
periódicamente con un cuestionario multitemático. 

Un problema de primer orden de las grandes encuestas 
realizadas en un momento concreto del tiempo es su coste. 
Muchas empresas no pueden soportarlo. Además, en muchos 
casos a la mayoría no les hace falta suministrar grandes 
cuestionarios con muchas preguntas para recoger la 
información que les es necesaria. Les basta con formular dos 
o tres preguntas para alcanzar sus objetivos. En estas 
circunstancias tienen la posibilidad de acudir a una 
encuesta ómnibus o encuesta en la que se obtiene 
información para varias empresas que comparten los costes 
de su obtención. 



Puede servir para cualquier realizar varias investigaciones 
simultáneas siempre que la muestra que responda tenga 
relación con el contenido diverso del cuestionario y que su 
dimensión sea suficiente. 

La encuesta ómnibus resulta muy útil para conocer los 
siguientes aspectos. 

• Características básicas de los mercados y, en concreto, 
el grado de consumo y compra de productos y marcas, 
el conocimiento de las marcas y hábitos de 
comportamiento de los consumidores. 

• Las características de colectivos o grupos de 
consumidores según sus variables sociodemográficas y 
socioeconómicas. 

• Actividades culturales y empleo de tiempo libre, como 
consumo de oferta cultural y turística. 

• Conocer opiniones sobre temas de interés general; 
política, sociedad, valores, etc. 

Las encuestas ómnibus resultan muy interesantes para 
aquellas empresas que no pueden, o no quieren, soportar el 
coste de investigaciones complejas y caras, con grandes 
muestras, siendo suficiente obtener información a través de 
unas pocas preguntas en grandes muestras. 

Para formar un ómnibus debe procederse como se indica a 
continuación. 

• En primer lugar es necesario definir la población de las 
que desea obtener información que puede ser de tres 
clases; personas de 14 años en adelante, hogares o 
cabezas de familia. 



• En segundo lugar, es necesario definir el ámbito 
geográfico en el que se obtendrá la información. 

• A continuación se calcula el tamaño de la muestra, 
mediante procedimientos similares a los expuestos en 
los apartados relativos a paneles. La muestra debe ser 
aleatoria y estratificada, y su tamaño oscila entre 1.000 
y 3.000 personas. Se manejan criterios de 
estratificación socioeconómica y geográfica, y es 
frecuente considerar las regiones Nielsen. 

• Finalmente, la muestra se localiza físicamente a través 
de rutas aleatorias en cada punto o lugar de muestreo 
respetando las cuotas establecidas. 

• La redacción del cuestionario debe realizarse como se 
describe en el capítulo próximo. La información se 
obtiene mediante encuesta personal o telefónica. 

Finalmente, las encuestas no personales son 
encuestas por correo. Las encuestas postales 
convencionales, se llaman así porque la recogida de la 
información se efectúa mediante un cuestionario que se 
envía a una persona, que lo cumplimenta y lo devuelve por 
correo. Junto a la encuesta se remite una carta de 
presentación, las instrucciones para su cumplimentación y 
un sobre franqueado para devolver el cuestionario. Es 
frecuente ofrecer algún incentivo al encuestado, 
generalmente en forma de obsequio, cuando devuelve la 
encuesta. 

3.8.3. Criterios determinantes a 
considerar para una adecuada 
elección dei tipo de encuesta 



Una duda que asalta al investigador es decidir qué tipo de 
encuesta conviene utilizar. Es necesario tener criterios para 
poder hacer la elección. Esos criterios tienen que ver con las 
características de la investigación, de la técnica en sí 
misnna, de la muestra, de las tareas de muestreo y de los 
encuestadores. El cuadro 3.12 resume los factores a 
considerar y los aspectos concretos de cada uno de ellos. 
Posteriormente se desarrollan. 


Cuadro 3.12. Factores a considerar en la selección 

del tipo de encuesta 


Factores a 
considerar 

Aspectos a considerar 


Complejidad de la información 
Control de encuestadores 

Coste de la investigación 

Facilidades para recoger 
información 

Facilidad para tratar la información 

Características de la 

Posibilidad de estudios de 

investigación 

comportamiento del consumidor 
Posibilidad de obtener tendencias 
de comportamiento 

Urgencia de la investigación 
Temporalidad de la investigación 
Utilidad para la gestión 

Zona geográfica del estudio 

Características y 

Conocimiento del hábitat 

posibilidades del tipo 

Posibilidad de empleo de material 

de encuesta que se 

auxiliar 

aplica 

Posibilidad de formular preguntas 
diversas 








Posibilidad de inferencia de 
conclusiones 

Tiempo necesario para recoger la 
información 

Anonimato percibido 
Aspectos sociodemográficos 
Concentración de población 
Control de coherencia 
Deseo de colaboración 
Características de la Influencia de terceros 
muestra Información delicada 

Nivel de participación, o de 
respuesta 

Veracidad esperada de las 
respuestas 

Volumen y densidad de población 

Accesibilidad 
Facilidad del muestreo 

Tareas de muestreo Posibilidad de inferencia de 

resultados 

Representatividad 

Flexibilidad para formular 
Características de los preguntas 
encuestadores Habilidad de los encuestadores 

Posibilidad de introducir sesgos 

Fuente: Elaboración propia. 

3.8.4. Características de la 
investigación 










Complejidad de la información. Cuando la información 
que deba recogerse sea compleja por su naturaleza, 
posiblemente la encuesta telefónica no sea la más 
adecuada. En ésta las preguntas deben ser cortas, porque 
cuando se recoge información por teléfono la comprensión 
es más difícil que frente a frente. La encuesta no debe durar 
más de 10 ó 15 minutos. Por el contrario, la encuesta a 
domicilio puede ser larga y se pueden formular preguntas 
complejas, porque el entrevistador puede dar explicaciones 
cuando sea necesario. 

Control de encuestadores. Los encuestadores podrían 
inventarse las respuestas a las preguntas que aparecen en 
los cuestionarios. Las empresas que desarrollan 
investigaciones de mercado deben controlarlos. Cuando se 
trata de encuestas a domicilio se pide al encuestado su 
teléfono y nombre (no apellidos). Se suele entrar en 
contacto con una parte de la muestra y se pregunta si 
efectivamente ha sido encuestada. En encuestas en 
establecimientos se observa disimuladamente cómo actúan 
los encuestadores. Mediante el sistema CATI se pueden 
obtener resultados por encuestador, o momento del tiempo 
en que se obtuvo la información, porque todos los datos 
quedan grabados en el ordenador y son imputables a cada 
encuestador. 

Volumen de información a recoger. Si se pretendiera 
obtener información sobre los gastos en diversos tipos de 
bienes y servicios de una población, la encuesta por teléfono 
no sería la técnica adecuada, debido al volumen y 
complejidad de la información. Sería más adecuada la 
encuesta postal. Posiblemente, la encuesta telefónica 
tampoco sea la técnica más adecuada para conocer cómo se 
alimenta la población. Recordar qué se ha consumido la 
víspera no sería muy difícil, pero detallar las compras de 
alimentos del último mes, para hacer estimaciones 



representativas, es imposible por teléfono. El cuestionario, 
largo y lento de responder, y el esfuerzo de memoria que 
implicaría, no aconsejan una encuesta por teléfono. 

Coste. Las encuestas personales tienen costes diferentes. 
La más cara es la realizada a domicilio. La telefónica y en 
establecimientos tienen un coste intermedio, y la postal es 
teóricamente la más barata, pues un sobre, una carta 
impresa y un franqueo concertado supone muy poco dinero. 
En función del presupuesto disponible se optará por la 
modalidad más asequible teniendo en cuenta los objetivos 
de la investigación. Las empresas deben decidir qué técnica 
aplicar ante unos objetivos dados de información, 
optimizando el compromiso calidad de la información -coste 
de su recogida. 

Facilidades para recoger la información. La encuesta 
a domicilio es la que más esfuerzos supone para recoger la 
información, porque hay que recorrer las ciudades buscando 
a las personas. Los encuestadores tienen que desplazarse y 
eso lleva tiempo. La encuesta por teléfono o la postal no 
suponen ningún desplazamiento, y éste es mínimo cuando 
se trata de encuestas en establecimientos. 

Facilidad para tratar la información. Cuando se 
utilizan encuestas postales, a domicilio, o en 
establecimientos, hay que grabar los datos en un ordenador, 
hay que «picarlos». Por el contrario, la encuesta telefónica 
asistida por ordenador permite que, a medida que el 
encuestador obtiene la información, ésta se almacene en un 
disco duro y se encuentre disponible inmediatamente para 
su tratamiento. 

Posibilidad de estudios de comportamiento del 
consumidor. Cualquiera de las encuestas mencionadas 
permite hacer estudios de comportamiento del consumidor. 



Si los estudios tuvieran que ser exhaustivos y complejos no 
serviría la encuesta telefónica, porque no se puede hablar 
mucho tiempo con las personas. Sería más conveniente la 
encuesta postal o a domicilio, si el presupuesto lo 
permitiera. Si se desearan estudios dinámicos sería 
conveniente una encuesta ómnibus. 

Posibilidad de obtener tendencias en el tiempo. Si se 
desea, además, que esos estudios sean dinámicos habrá que 
utilizar la encuesta ómnibus, porque proporciona 
información de la misma muestra a lo largo del tiempo y se 
pueden detectar tendencias en las variables estudiadas. Si 
se emplearan las otras encuestas las muestras serían 
distintas y los estudios menos comparables. 

Urgencia. La encuesta postal es muy lenta. El proceso 
dura casi un mes. Si el Gobierno deseara conocer la 
intención de ir a votar en unas elecciones, quince días antes 
de su celebración, no utilizaría encuestas postales, pues son 
un sistema lento de recogida de información. La encuesta 
telefónica sería la mejor solución, porque la información se 
obtiene rápidamente; si fuera preciso en cuestión de horas. 
Las encuestas a domicilio requieren tiempo, no sólo el 
exigido por la obtención de información, que puede durar 
horas, incluso. Los entrevistadores tienen que desplazarse 
hasta los domicilios de los entrevistados, hecho que 
incrementa el tiempo efectivo de obtención de información. 
Los encuestadores no pueden encontrarse con muchas 
personas al día. El proceso de recogida de información 
puede durar semanas en algunos casos. 

Temporalidad. Existen comportamientos de los 
consumidores ligados al tiempo. La encuesta a domicilio en 
época navideña no es oportuna; tampoco lo será en verano. 
Las encuestas en establecimientos pueden estar sesgadas 
en Navidades o en época de rebajas. Los meses neutros 



suelen ser marzo y octubre. La encuesta telefónica parece 
más adecuada en cualquier época del año. La postal se ve 
entorpecida en Navidad, debido a la saturación de los 
servicios de correos. La distribución de las personas que se 
encuestan en establecimientos no es temporalmente 
uniforme. Las personas mayores compran sobre todo a 
primeras horas de la mañana. Los martes a mediodía casi 
nadie visita los grandes almacenes. Las personas que 
trabajan fuera de sus casas compran los fines de semana. 
Por razones de temporalidad de las observaciones, la 
información que proporcionan las encuestas en 
establecimientos puede estar sesgada hacia algún grupo de 
población o clase clasificada por edad, género, status 
socioeconómico, etc. 

Utilidad para la gestión. Si las empresas desean 
obtener información para tomar decisiones trascendentes, 
las encuestas deben distribuirse entre muestras aleatorias. 
La encuesta en establecimientos es la única de las 
mencionadas que no emplea muestras aleatorias. Los 
resultados que proporciona no se pueden generalizar, y las 
conclusiones a las que se llega son orientativas. Si una 
empresa deseara controlar la evolución de la cuota de 
mercado de sus productos, no debería estar haciendo 
encuestas a los consumidores constantemente. Podría 
contratar los servicios de alguna empresa que recogiera esa 
información a través de paneles, o una encuesta ómnibus. 
Le sería mucho más cómodo, más barato y efectivo contratar 
los servicios de empresas especializadas en la recogida y 
tratamiento de este tipo de información. 

Zona geográfica del estudio. Cuando una investigación 
deba desarrollarse en una zona geográfica muy amplia, la 
encuesta a domicilio es más lenta y cara. La telefónica o 
postal se antojan más convenientes, pues con ellas se puede 
llegar a una muestra determinada por muy alejada o 



dispersa que esté. Desde cualquier ciudad se pueden enviar 
cartas que llegan hasta el último rincón. En las zonas de 
baja densidad de población es donde la encuesta postal se 
ha revelado más útil. En ciertos lugares, con poblaciones 
muy dispersas, el trabajo de los encuestadores sería lento, 
fatigoso y, además, caro. Lo mismo puede decirse de los 
países escandinavos, especialmente en invierno. Las 
encuestas por correo o por teléfono resultan especialmente 
recomendables en estos casos. 


3.8.5. Características y posibilidades 
del tipo de encuesta que se 
aplica 

Conocimiento del hábitat. En la encuesta a domicilio, 
el encuestador puede proporcionar una información muy 
valiosa sobre la vivienda -en qué zona se encuentra, cómo 
es, cómo está orientada, tamaño, etc.- o qué aspecto tiene 
la persona que responde a la encuesta. Esa información 
cualitativa complementaria puede ser muy interesante. Por 
ejemplo, en un estudio sobre la estructura de gasto en 
bienes y servicios, el encuestador que visita a las personas a 
domicilio, podría observar la altura y orientación de la 
vivienda -interior o exterior y geográfica- y obtener datos 
muy interesantes que pueden influir en el consumo de 
energía eléctrica. Por correo o por teléfono es más difícil 
conocer el hábitat de las personas. 

Posibilidad de empleo de material auxiliar. En las 

encuestas a domicilio se pueden mostrar fotos, muestras, 
bocetos, catálogos, etc. Las empresas que deseen obtener 
información para diseñar nuevos productos pueden 
presentar maquetas de prototipos, o fotos, para que las 
personas los valoren. Tratándose de nuevos servicios se 



pueden mostrar tarjetas que contengan diversas 
combinaciones de los mismos, para que el encuestado 
ordene sus preferencias. Esto no se puede hacer con la 
encuesta telefónica, y con la postal es más complicado y 
caro. 

Posibilidad de formular preguntas diversas. A veces, 
los encuestadores tienen que formular preguntas 
alternativas, porque los encuestados no comprenden bien 
las que se hacen. Esto no puede hacerse por correo, y sí 
mediante encuestas personales. Se corre el riesgo de que en 
la formulación de las preguntas el encuestador introduzca 
sesgos. Esto no ocurre con la encuesta telefónica por 
ordenador, pues las diferentes alternativas están ya 
redactadas y sólo basta leerlas, pues el programa CATI la 
muestra en pantalla. 

Posibilidad de inferencia de resultados. Siempre que 
se trate de muestras aleatorias, los resultados se pueden 
generalizar con cierto grado de error y confianza. Sólo la 
encuesta en establecimientos no es aleatoria y no se pueden 
generalizar sus resultados. 

Participación. El porcentaje de personas que colabora 
dando información es variable. Cuando se trata de 
encuestas postales ronda el 10%. Con encuestas telefónicas 
oscila entre el 50 y el 60%. Estos porcentajes deben ser 
tenidos en cuenta porque las muestras efectivas requieren 
muestras teóricas más amplias. Para conseguir participación 
se suele incentivar a las personas con regalos o dinero. 

Tiempo necesario para recoger la información. En 

las encuestas postales el tiempo de recogida de la 
información no es corto. Aproximadamente, el proceso viene 
a durar un mes, sin que sea posible reducirlo en la práctica. 
En este sentido influye mucho la eficacia de los servicios 



postales. Se deduce que la encuesta postal no es la técnica 
más conveniente para obtener información con carácter de 
urgencia. Por el contrario, el teléfono permite obtener 
información en pocas horas. 


3.8.6. Características de la muestra 

Anonimato percibido. Responder a una encuesta puede 
percibirse como una intromisión en la intimidad de las 
personas. La obtención de respuestas será tanto más fácil 
cuanta más alta sea la sensación de anonimato por parte de 
los encuestados. En este sentido, la encuesta por correo es 
la más anónima. A domicilio es la menos anónima. Por 
teléfono la sensación de anonimato es intermedia. 

Aspectos sociodemográficos. Las características de la 
población de la que se extraerá la muestra afectan a la 
elección del tipo de encuesta. Conviene tener en cuenta 
factores como la facilidad de su localización -a través de 
censos-, indicadores demográficos (género, edad, zona de 
residencia) y socioeconómicos (renta, profesión, etc.), nivel 
cultural, etc. Si la población es culta entenderá los 
cuestionarios y podrá responderlos sin ayuda de nadie. Si 
fuera iletrada sería necesario localizar a las personas y 
leérselos; habría que acudir a encuestas personales. 

Concentración de población. Cuando una población se 
encuentra muy concentrada, en una ciudad, por ejemplo, es 
posible acudir a los domicilios de las personas para 
encuestarlas. Si estuviera muy dispersa, como sucede en 
algunos territorios de EE.UU. o en los países nórdicos, la 
encuesta postal o telefónica son aconsejables. En la 
encuesta en establecimientos la muestra de personas 
encuestadas puede proceder de un área geográfica extensa. 
Esta circunstancia es muy interesante, pues permite recoger 



información de personas distantes con un coste bajo, pues 
se ahorran desplazamientos, dietas o llamadas telefónicas. 
Por teléfono el área geográfica del estudio puede ser muy 
amplia y no importa si la población está concentrada o no. 

Control de coherencia. Mientras responden los 
encuestados puede haber dificultades para detectar 
incoherencias cuando la encuesta es a domicilio o por 
teléfono. Si aparecieran en encuestas postales nada se 
puede hacer cuando se reciben. La encuesta telefónica CATI 
detecta inmediatamente incoherencias en las respuestas. El 
entrevistador recibe instrucciones por pantalla y salta a las 
preguntas convenientes cuando obtiene respuestas a 
preguntas filtro. 

Control del proceso de investigación. Cuando se 
realiza una investigación con encuestas interesa conocer 
cómo se desarrolla el proceso, es decir, «cómo van las 
cosas»; por ejemplo, qué porcentaje de muestra se ha 
encuestado, cuotas de muestreo alcanzadas - porcentaje de 
hombres, mujeres, ciudades, jóvenes, etc. El control del 
muestreo es máximo e inmediato mediante el sistema CATI. 
Las demás técnicas exigen recuentos físicos de cuestionarios 
y sus clasificaciones, salvo que se utilicen lectores ópticos. 
En el sistema CATI toda la información recogida se almacena 
en un disco duro, y en cualquier momento se puede conocer 
cuántas personas han sido encuestadas en total, cuántas 
son hombres, mujeres, etc. Cuando se alcanzan las cuotas 
deseadas -por ejemplo, 345 hombres de clase media- se 
deja de obtener información de ese estrato, porque el 
programa proporciona una parada automática cuando se 
alcanza las cuotas prefijadas previamente grabadas en el 
ordenador. 

Calidad de la información. La encuesta postal permite 
al encuestado unas respuestas más meditadas y anónimas. 



sin las prisas o los agobios de tener que responder de 
inmediato a un encuestador a domicilio o por teléfono. La 
persona elige el momento más adecuado para responder. 
Sin embargo, algunos estudios revelan que la fiabilidad o 
veracidad de las respuestas por teléfono es mayor que 
cuando se trata de encuestas postales. Tratándose de la 
encuesta telefónica pueden surgir dificultades de 
comprensión, especialmente con los mayores. Es posible que 
algunas personas crean que están siendo objeto de una 
broma. Con el teléfono es más difícil controlar la coherencia 
de las respuestas debido a la rapidez con que se 
proporcionan. Suele ser difícil volver atrás y repasar lo que 
se ha dicho. Esto no ocurre con el sistema CATI. 

Deseo de colaboración. En la encuesta a domicilio, si 
se exponen bien los objetivos de la investigación las 
personas no suelen negarse a colaborar. En este sentido 
también influye mucho la confianza que proporcionen los 
encuestadores. Son muy importantes su aspecto personal y 
modo de comportarse en general. Por correo es más difícil 
conseguir colaboración. En los establecimientos la gente 
suele tener prisa, y no le gusta pararse a responder. 

Influencia de terceros. Cuando se envía una encuesta 
por correo para ser cumplimentada y devuelta no se tiene la 
completa seguridad de que haya contestado la persona 
seleccionada o de que no haya sido influenciada. Es posible 
incluso que las respuestas hayan sido «aprobadas» por un 
«equipo de personas». En encuestas personales a domicilio, 
en establecimientos o por teléfono no hay influencia de 
terceros. 

Información delicada. Ante un encuestador que 
pregunta información delicada, como preferencias sexuales, 
ideologías políticas, ingresos, etc. una persona se puede 



sentir cohibida. Por teléfono la incomodidad es menor, y 
puede decirse que desaparece cuando la encuesta es postal. 


3.8.7. Tareas de muestreo 

Accesibilidad de la muestra. La accesibilidad de una 
muestra depende del tipo de encuesta que se emplee. Por 
teléfono muy fácil entrar en contacto con la muestra, pues 
basta con marcar un número y repetir las veces necesarias la 
llamada en caso de no encontrar respuesta. También permite 
encuestar a personas difícilmente accesibles, como 
ejecutivos, etc., o que viven en lugares lejanos, o cuando 
hace mal tiempo. Obviamente sólo puede emplearse con 
personas que tengan teléfono, y eso la limita a zonas donde 
su posesión se encuentra generalizada. El sistema CATI 
genera automáticamente los números de teléfono y 
simplifica mucho el muestreo. La accesibilidad de la muestra 
en encuesta a domicilio es menor, pues requiere tiempo y 
desplazamientos. Por correo hace falta conocer antes 
nombres y direcciones, es decir, una población y sus señas 
postales para acceder a ella. 

Facilidad del muestreo. Mediante encuesta telefónica 
convencional o CATI es fácil de planificar el muestreo. Los 
números del teléfono se asocian a barrios, ciudades o 
provincias. Se puede programar el número de los teléfonos 
para que su selección proporcione muestras estratificadas y 
mantenga la representatividad de las zonas. Por ejemplo, 45 
números que empiecen 91452 **** corresponde a 45 
abonados localizados en la provincia de Madrid. En 
encuestas a domicilio, o por correo, la planificación del 
muestreo y la localización de las muestras en más difícil. 

Posibilidad de inferencia de resultados. Como ya se 
ha expuesto anteriormente, sólo las muestras aleatorias 



proporcionan resultados generalizables. Sólo la encuesta en 
establecimientos recoge información de muestras no 
aleatorias. 

Representatividad de la muestra. Cuando se trata de 
encuesta postal puede que la muestra de respondientes no 
sea representativa, debido a que el mayor porcentaje de 
respuestas lo da la clase media. En países poco 
desarrollados la encuesta telefónica recogería información 
de personas de clase alta, quienes presumiblemente son las 
únicas que poseen teléfono en estas naciones o zonas. 


3.8.8. Características de los 
encuestadores 

Flexibilidad para formular preguntas. Los 

encuestadores deben formular preguntas a la muestra a 
veces de forma rígida o flexible, es decir, preguntan sobre 
un cuestionario cerrado y marcan las respuestas, o formulan 
las preguntas en términos menos concretos. En 
establecimientos conviene ser rápido y no entretener 
demasiado a las personas. Los cuestionarios serán cerrados. 
A domicilio se pueden hacer preguntas abiertas. La encuesta 
postal no es flexible. La telefónica especialmente CATI y a 
domicilio dan la opción a la flexibilidad de los 
encuestadores. 



Cuadro 3.13. Sfntesto de caracterlatlcas de las encuestas 


TIPOS DE ENCUESTAS 

Caractenstica a tañer en cuenta 

A domcAo 

EsUbteclrraentoa 

TeMforw 

CAR 

Postal 

Omnibus 

CompleeOad de la ntotmación que 

te puede recoger 

Mucha 

Poca 

Poca 

Poca 

Moderada 

Moderada 

Control de encuestadores 

Moderado 

Alto 

Sío 

Máximo 



Coste de la técnca 

Alto 

Moderado 

Moderado 

Moderado 


Moderado 

FacAdades dadas para recoger nlormacidn 

Moderadas 

Moderadas 

Moderadas 

Moderadas 

Pocas 

Moderadas 

FacAdad pera tratar la ntonnacidn 

MstSa 

Media 

SRá 

MAxima 

Media 

media 

Posibilidad de estudios de comportsrraento 

del consumidor 

Buena 

Buena 

Buena 

Buena 

Bueru 

Máxima 

Posibilidad de obtener lendencaas 

Nula 

Nula 

Nula 

Nub 

Nula 

Muy txjena 

Utilidad en caso de urgenca 

Bija 

Moderada 

Arta 

Máxima 

Muy bata 

Muy bata 

Utilidad para la oeetiún 

Muybuttrtá 

Moderada 

Muy buer>a 

Muy buaoa 

Buena 

Muy buona 

An>p(ilud Q6ográf^ <M MtiKio 

Ba^ 

Alta 

Muy^ 

Muy afta 

Muy alta 

Muy alta 

Conocimientos del Ubitai del encuestado 

Muy altos 

Baios 

Nulas 

Nulos 

Nulos 

Nulos 

Posibilidad de empleo de matenal auxiliar 

Muy «Ma 

Mo^aída 

RSE 

ñüB 

FOa 

RÜ5 

PosíNidad formular pr«gunt«a drwvaaa 

Mámma 

Muy alta 

Muy afta 

Máxima 

FB5 

nos 

Posibilidad de inferencia de ratUtados 

Máwma 

KUa 

Máxima 

Máxsma 

Máxima 

Máxima 

Tiempo necesario para recoger la miormación 

hAicho 

Moderado 

Corto 

Cono 

Muclio 

Alio 

Anon«nalo percaado 

Mirumo 

Mínimo 

Moderado 

Moderado 

Máximo 

Máximo 

Control de coherencia de respuestas 



Bato 

Máximo 



Deseo de colaboración 

Bato 

Bttro 

Moderado 

Moderado 

Moderado 

XHo 

Mluencaa de terceros 

NUa 

RíSa 

Nula 

Nula 

Alta 

Moderada 

Obtención de información delicada 

DtfiCil 

Nula 

Poco difícil 

PocodUical 

Fácil 

Fádl 

Nivei de partic«ación. o de respuesta 

Alto 

Moderado 

Moderado 

Moderado 

HSÉ 

AHo 

FiabOidad de respuestas 

Aka 

Dudosa 

Arta 

Arta 

Moderada 

Aka 

Accesibilidad a la muestra 

Difícil 

FOcil 

fioi 

WüyHcS 

Oificá 

Wiéil 

FacAdad del mueetreo 

Difícil 

No se emplea 

FéCé 

MuyflcA 

caa 

0351 

PoeiMidad de inferencia da raeiAados 

Afta 

Nula 

Ala 

ANa 

AKá 

Alta 

Represenlatindad de la muestra 

Jiita 

RüE 

Moderada 

Moderada 

Moderada 

Moderada 

Flsubilldad para formular preguntas o matizartas 

MAxsna 

Moderada 

Basa 

Máxima 

Nula 

Nula 

Habilidad reguenda a k» encuestadores 

Máxsna 

Normal 

Ana 

Ana 



Riesgo de sesgos 

Moderado 0 bAie 

Elevado 

Elevado 

Moderadoobso 

No existe 

No exista 


fitrntr. niuKuuciiW) pntpiu. 

Habilidad de los encuestadores. El encuestador que 
obtiene información a partir de encuestas a domicilio o por 
teléfono requiere una habilidad especial para hacer 
preguntas o dar explicaciones. Si una empresa dudara de la 
habilidad de los encuestadores podría utilizar la encuesta 
postal. 

Sesgos. Los errores que pueden aparecer durante el 
proceso de recogida de información son parcialmente 
debidos a los encuestadores, porque leen mal, se equivocan 
al marcar las respuestas, o confunden a los encuestados. En 
toda encuesta personal aparecen sesgos debidos a los 
encuestadores, en mayor o menor grado, cosa que no 
ocurre, obviamente, cuando se trata de encuestas postales. 


Finalmente, el cuadro 3.13 sintetiza las características de 
las encuestas con objeto de hacer comparaciones entre ellas 
y de proporcionar criterios para su selección. 













































3.8.9. Utilización conjunta de las 
encuestas 

Los diversos tipos de encuestas tienen sus limitaciones. 
Ninguna de ellas puede decirse que sea netamente superior 
a la demás. En la práctica es frecuente combinarlas. 

Se puede entregar un cuestionario en mano en el 
momento oportuno, en una visita concertada. 
Posteriormente se puede llamar por teléfono para concertar 
una cita y recogerlo. Este procedimiento se emplea cuando 
los cuestionarios son largos y necesitan de explicaciones 
para su cumplimentación. 

También se puede llamar por teléfono para anunciar el 
envío de un cuestionario postal y conseguir así una mayor 
tasa de respuesta. Posteriormente se vuelve a llamar para 
recordar que se pasará a por el cuestionario. Actuando en 
estos términos se pueden conseguir tasas de respuesta del 
90%, con un porcentaje de cuestionarios útiles del 75%. 

Los investigadores pueden llamar por teléfono para 
concertar una cita y realizar una encuesta. De esta forma se 
consigue una elevada tasa de respuesta. Tratándose de una 
encuesta postal se puede llamar a las personas que no han 
respondido para insistir en su colaboración. Tras realizar una 
entrevista personal se puede llamar por teléfono para 
verificarla información proporcionada. 
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EXPERIMENTACIÓN Y 
DISEÑO DE 
EXPERIMENTOS 

4.1. OBJETIVOS DEL CAPÍTULO 

Una vez consultado este capítulo el lector habrá adquirido 
conocimientos sobre, 

• El concepto y las condiciones de la causalidad. 

• Conceptos básicos para diseñar experimentos: variables 
y unidades de prueba. 















• Qué es la validez interna y externa de la 
experimentación. 

• Qué son variables extrañas en los experimentos. 

• Cómo se controlan las variables extrañas. 

• Qué son experimentos de laboratorio. 

• Qué son diseños pre-experimentales y qué clases 
existen. 

• Qué son diseños experimentales y qué clases existen. 

• Qué es la experimentación comercial: al azar, por 
bloques aleatorios y en cuadrado latino. 

• Cuáles son los límites y validez de la experimentación 
comercial. 

4.2. CAUSALIDAD Y 
EXPERIMENTACIÓN 

Una relación causal se puede definir como aquélla 
detectadle, según la cual un hecho llamado consecuencia es 
atribuidle a otro llamado causa. La experimentación se 
puede definir como la creación de unas determinadas 
condiciones para medir, mediante procedimientos diversos, 
entre los cuales se incluyen los estadísticos, los efectos de 
una variable o variables que se controlan, sobre unos 
resultados que se suponen consecuencia de las variables 
controladas. 

Un experimento, en su acepción más amplia, consiste en 
la creación de unas condiciones para comprobar la 




influencia de una causa sobre unos resultados. Los 
experimentos pueden de dos clases. 

• Experimentos directos, semejantes a los que se 

desarrollan en las ciencias naturales, que suponen un 
conocimiento previo del fenómeno que se pretende 
estudiar, porque existe una teoría que relaciona las 
variables. Por ejemplo, la Teoría Económica establece que 
precio y cantidad se mueven en sentido inverso. Una 
reducción de un precio para medir su efecto sobre las 
ventas constituye un experimento directo. 

• Experimentos indirectos, que consisten en crear unas 
condiciones para observar unas consecuencias, sin hipótesis 
formales previas. Por ejemplo, una empresa podría probar 
un nuevo producto en un mercado para observar su 
aceptación por los consumidores, el interés de 
distribuidores, su difusión, determinar qué canal de 
distribución es el más conveniente, etc. 

En cualquier experimento existen las siguientes variables. 

• Variables independientes. Son aquéllas que se 
controlan y que se suponen causales: por ejemplo, el precio 
que una empresa fija a su producto, o el envase que diseña, 
son variables independientes. 

• Variable dependiente es aquélla que se supone tiene 
que responder ante las modificaciones de las variables 
independientes. Es la consecuencia, o efecto ante la causa. 
Por ejemplo, las ventas, que se suponen alterables ante las 
modificaciones de los precios si los demás factores causales 
permanecieran constantes. 

• Variables ajenas o extrañas. Son aquéllas distintas 
de las independientes que afectan a los resultados, o 
consecuencias. O no se controlan o no son controlables. Por 



ejemplo, una empresa puede bajar el precio de un producto 
para estudiar su efecto sobre las ventas. Es posible que al 
mismo tiempo tenga lugar una campaña publicitaria. Podría 
suceder que los competidores imitaran a la empresa, y 
también bajaran el precio. La publicidad y la imitación de la 
competencia son variables extrañas, porque pudiendo ser 
controladas no lo son, como la propia publicidad, o no se 
pueden controlare actuar sobre ellas, como los precios de la 
competencia. 

• Unidades de prueba. Son las que responden a las 
causas. Por ejemplo, las personas, los establecimientos 
comerciales o los mercados geográficos son ejemplos de 
unidades de prueba. 

Los experimentos deben tener la propiedad de validez. Es 
decir, deben permitir proponer la existencia de relaciones 
causa efecto. La validez de los experimentos puede ser 
interna y externa. 

• La validez interna es una medida de la precisión de un 
experimento. Existe validez interna si en un experimento la 
causa origina un efecto. Por ejemplo, si una reducción de los 
precios aumenta las ventas, se dice que existe validez 
interna 

• La validez externa hace referencia a la posibilidad de 
generalización de la relación de causalidad encontrada. 
Consiste en poder llegar a formular leyes de 
comportamiento. Si existe validez externa quiere decir que 
se puede confiar en que las mismas causas provocan los 
mismos efectos. Si existiera validez externa significaría que 
siempre que se redujera el precio las ventas se moverían en 
sentido contrario. 



4.3. CONDICIONES DE LA 
EXPERIMENTACIÓN 

Para poder establecer relaciones de causalidad es necesario 
que se den las siguientes condiciones. 

• Secuencia temporal de ocurrencia de los sucesos. 

Esta condición significa que el suceso que se supone causa, 
una reducción en el precio, por ejemplo, tiene que 
producirse antes que la consecuencia, un probable 
incremento de las ventas. Es decir, la causa antecede a la 
consecuencia. 

• Variación concomitante. Esta condición consiste en 
que una causa y un efecto ocurren casi juntos o que la 
consecuencia se observa de forma casi inmediata a la causa. 
La secuencia temporal de ocurrencia causa-efecto tiene que 
ser muy rápida. Si se bajara hoy el precio de un producto y 
las ventas aumentaran dentro de ocho meses, la causa del 
incremento sería otra distinta del precio modificado, porque 
habrían aparecido otras causas dentro de un intervalo 
temporal tan amplio. 

• Ausencia de otras causas posibles. La relación causa 
efecto debe excluir otras posibles causas. Si una empresa 
redujera precios y como consecuencia se incrementaran las 
ventas, antes de establecer una relación de causalidad, 
debería asegurarse que las demás variables que inciden 
sobre la cifra de negocio, por ejemplo, la publicidad o los 
esfuerzos de los vendedores, no se han alterado. Así se 
podría formular, céteris paribus, que una reducción del 
precio incrementa las ventas. 

Para poder detectar las relaciones causa efecto es necesario 
proceder al desarrollo de un diseño experimental, que 



consiste en la especificación de los grupos que se 
analizarán, del conjunto de procedimientos y pruebas que 
se efectuarán, variables que se controlarán y cómo se 
actuará. Por ejemplo, podría diseñarse un experimento, 
como bajar el precio de la Coca Cola en una cadena de 
hipermercados, en el sur de España, en sábado, sin 
anunciarlo previamente en ningún medio para medir su 
efecto sobre las ventas respecto a los últimos sábados. 

• Los experimentos deben ser aleatorios. Las 

unidades de prueba no deben ser elegidas. Si una cadena 
de hipermercados deseara medir el efecto de las 
modificaciones del precio de un producto sobre las ventas, 
debería «sortear» en qué establecimientos habría que 
alterarlo. Los seleccionará al azar. Si se quisiera medir el 
efecto del diseño de unos anuncios en la población se 
seleccionarían al azar las personas y los diseños que se les 
mostrarían. 

• Las unidades de prueba, tanto personas, como 
establecimientos y entidades en general, no deben ser muy 
dispares en sus características fundamentales. 

• En la medida de lo posible deberá procederse a un 
control de las variables extrañas, las que no se pueden 
controlar, aplicando para ello algunas técnicas 
cuantitativas, como el análisis de la varianza con datos 
absolutos o por rangos. 

4.4. VARIABLES EXTRAÑAS: 
CONCEPTO Y CONTROL 

En el desarrollo de los experimentos unas variables son 
directamente causales, o al menos así se las considera, 
que son las que se alteran para medir unos efectos o 



consecuencias. Pero existen otras variables que los 
experimentadores no controlan podiendo hacerlo, o no 
pueden controlar, y que pueden afectar a los resultados. 

Son las siguientes, 

• Historia. Se entiende por tal el conjunto de sucesos 
ajenos a un experimento que ocurren al mismo tiempo que 
él, y que pueden producir confusión a la hora de establecer 
relaciones de causalidad. Por ejemplo, una empresa que 
reduce sus precios ve incrementar sus ventas. Podría 
proponer que la reducción del precio incrementa las ventas. 
Sin embargo, podría haber sucedido que mientras la 
empresa ha bajado el precio, su competidor ha sufrido un 
incendio que le impide producir y vender. La empresa que 
ha bajado el precio vende más porque excepcionalmente 
atiende a un mercado desabastecido por un hecho fortuito. 
También las ventas podrían haber aumentado por razones 
de moda, cambios de valores, etc. 

• Maduración. Consiste en los cambios observados en las 
unidades de prueba cuando un experimento se prolonga en 
el tiempo. Las personas cambian, adquieren experiencia o 
se aburren y los establecimientos que colaboran pueden 
dejar de hacerlo. Por ejemplo, si una empresa bajara 
lentamente el precio en un mercado, puede que los 
compradores se sensibilizaran con el precio y buscaran otras 
marcas más baratas. Si se experimentaran campañas de 
comunicación tal vez las personas se volvieran más 
sensibles y críticas con los productos o sus marcas. 

• Medición de efectos. Cuando se realizan mediciones 
pueden aparecer lo que se denominan efectos, o 
comportamientos especiales en las unidades 
experimentales. Estos efectos pueden ser principales e 
interactivos. Los efectos principales aparecen cuando 
una observación previa afecta a otra posterior. Por ejemplo. 



la medición de actitudes ante una marca, antes de lanzar 
una campaña publicitaria sobre ella, puede sensibilizar a las 
personas sobre esa marca. Un estudio posterior podría 
revelar que la campaña no ha tenido éxito porque tal vez las 
personas traten de ser coherentes con las opiniones que 
antes han vertido. Cuando aparece este efecto se pone en 
tela de juicio la validez interna del experimento. El efecto 
principal puede anular sus consecuencias. 

• Los efectos interactivos consisten en que una 

medición previa afecta a las respuestas de las unidades 
experimentales ante el experimento y durante él. Por 
ejemplo, si a un grupo de personas se les preguntara por sus 
actitudes ante los coches de la marca SEAT, puede que se 
convirtieran en personas mucho más críticas con esta marca 
y con los anuncios que se estuvieran experimentando. No 
verían los anuncios con los mismos ojos que si esas 
preguntas no se hubieran hecho. En cierto modo el efecto 
interactivo se parece mucho a la maduración. Esta es 
consecuencia de cambios en las personas debidos a su 
evolución personal, mientras que el efecto interactivo 
provoca cambios como consecuencia del propio 
experimento. Cuando éstos tienen lugar en un intervalo 
temporal corto el efecto interactivo es reducido, incluso 
nulo, porque no da tiempo a que las personas lo desarrollen. 

• Instrumentación. Esta variable se refiere a cambios 
posibles en los soportes materiales y humanos de recogida 
de información durante el experimento. Es posible que 
cambien los cuestionarios que se empleen, por haber sido 
rediseñados. También pueden cambiar los encuestadores o 
entrevistadores, que podrán ser más o menos hábiles o 
simpáticos que los anteriores. Lo mismo puede decirse de 
los observadores, cuya inteligencia podrá ser más o menos 
imparcial, aguda o crítica. Todos estos factores pueden 



introducir sesgos en las mediciones antes y después de los 
experimentos. 


• Regresión estadística. Consiste en la tendencia que 
manifiestan las personas a abandonar posturas extremas a 
medida que se desarrollan los experimentos. Esto puede 
inducir a confusión, porque no se sabe si los cambios son 
debidos a esa tendencia observada o son consecuencia del 
experimento. 

• Sesgos en la selección de las unidades 

experimentales. Cuando se desarrolla un experimento se 
colabora con personas o entidades, como empresas, o se 
actúa en mercados, etc. Es posible que no se seleccionen los 
más representativos y esto seguramente causará sesgos y 
afectaría a la validez interna del experimento. 

• Mortalidad. Significa que las unidades experimentales, 
las personas, pueden negarse, en algún momento, a 
continuar colaborando en el desarrollo del experimento, y 
tengan que ser sustituidas por otras que ya no serán las 
mismas, aunque sean parecidas. 

Para conseguir reducir los efectos de las variables extrañas 
los experimentos deben reunir una serie de condiciones. 

• Deben ser aleatorios. Las unidades de prueba no deben 
ser elegidas. Si una cadena de hipermercados deseara 
medir el efecto de las alteraciones del precio de un producto 
sobre las ventas, debería «sortear» en qué establecimientos 
alterarlo. Los seleccionará al azar. Si se quisiera medir el 
efecto del diseño de unos anuncios en la población se 
seleccionarían al azar las personas y los diseños que se les 
mostrarían. 

• Las unidades de prueba, tanto personas, como 
establecimientos y entidades en general, no deben ser 



muy dispares en sus características fundannentales. 

• Deben utilizarse diseños experimentales, pues ellos 
garantizan la eliminación de las variables extrañas. Los 
diseños pre-experimentales no son de gran utilidad, como 
se verá en el próximo apartado. 

4.5. DISEÑO DE EXPERIMENTOS 

Los experimentos pueden ser distintas clases, tal como se 
explica en el g ráfico 4.1 . y se expone a continuación. 

Gráfico 4.1. Clases de experimentos 

Elimage 


4.5.1. Experimentos de laboratorio 

Con frecuencia las empresas toman muestras de una 
población a la que someten a diversas pruebas, en sus 
domicilios o en lugares especialmente acondicionados para 
ello. Algunas de ellas son las siguientes. 

• Pruebas ciegas. Consisten en proporcionara los 
consumidores muestras de productos para que los prueben 
sin que sea posible que los distingan por su denominación 
de marca. Persiguen una valoración de los productos por sus 
características intrínsecas, no según el valor de la marca. A 
veces en las pruebas se muestran las denominaciones de 
marca para conocer el efecto en los cambios de percepción 
que tiene la imagen del fabricante. Por ejemplo, se pueden 
entregar muestras de diferentes detergentes en saquitos, 
llamados A, B, C ... que no hagan referencia a las marcas 
verdaderas para que las personas laven la ropa y los 
juzguen. Sólo quien desarrolla en experimento conoce la 
verdadera identidad de las marcas. 



• Pruebas de envases. Antes de diseñar un envase 
definitivo se prueban prototipos para que los consumidores 
opinen sobre aspectos estéticos o funcionales. 

• Pretest publicitarios. Las campañas de comunicación 
son caras. Un anuncio puede estar mal diseñado. El mensaje 
puede no entenderse bien, o el diseño general podría 
resultar inadecuado para el segmento de mercado al que se 
dirige, por los actores, los slogans, etc. Un pretest 
publicitario es una prueba de laboratorio en la que las 
personas opinan sobre un anuncio en aspectos como su 
atractivo, significado, poder de convicción, etc. 

• Post-test publicitarios. Una vez lanzadas las 
campañas, los anunciantes se interesan por los resultados 
de la comunicación. Se puede seleccionar una muestra de 
personas para someterla a pruebas de reconocimiento (qué 
anuncios reconoce haber visto antes) o de recuerdo, (se 
explican anuncios que se recuerdan) espontáneo o sugerido. 
También se pueden medir cambios de actitudes (ante el 
racismo) o conductas (uso del cinturón de seguridad). 

• Sketching. Esta técnica consiste en simular un 
establecimiento comercial (de alimentación, generalmente) 
totalmente desordenado. Se invita a unas personas a que 
simulen sus compras. La técnica sirve para conocer en qué 
orden las realizan y poder decidir así la localización física de 
los productos en las góndolas de la forma más eficiente. 

• Test de Abelson. Esta prueba se emplea para medir la 
fidelidad a la marca de los consumidores. Consiste en 
ofrecer un incentivo para cambiar una conducta. Por 
ejemplo, dinero por dejar de consumir una marca. Cuanto 
mayor sea la fidelidad mayor tendrá que ser el incentivo. 

Sin embargo, la «oferta» del incentivo es ficticia. 



• Repertorio de Kelly. Esta prueba consiste en mostrar 
productos en lotes de tres, para que los consumidores digan 
por qué dos productos de cada uno se parecen entre sí y 
difieren de un tercero. Si se mostraran una pluma, un 
rotulador y un lápiz se podría pedir a una persona que 
explicara qué tienen en común la pluma y el rotulador y en 
qué se diferencian del lápiz. Podría decir que los dos 
primeros objetos escriben con tinta, y que se diferencias del 
lápiz porque él lleva una mina sólida. Todos ellos tendrían 
en común que son objetos de escritura, alargados y para 
escribir a mano. El repertorio de Kelly sirve para conocer en 
qué atributos se fijan los consumidores en los bienes y 
servicios. 

• Experimento de Taylor. Esta técnica consiste en 
ofrecer productos o servicios a las personas de forma 
secuencial, para que pongan de manifiesto las diferencias 
que perciben en ellos, a medida que su número aumenta. Se 
ha podido comprobar que la percepción de diferencias 
disminuye a partir de cinco o seis variantes. Esta técnica es 
muy útil para tomar decisiones de amplitud de gama. Si las 
gamas son muy amplias los consumidores no perciben bien 
las diferencias entre las distintas alternativas que se les 
ofrecen y ello dificulta las tareas de fijación de precios, 
selección del segmento objetivo para el producto, así como 
estrategias de comunicación y distribución. La disparidad de 
alternativas también dificulta la elección de los 
consumidores y aumenta la percepción de riesgo de una 
compra poco acertada. 

4.5.2. Diseños pre-experimentales 

Se llaman así porque constituyen una aproximación a los 
métodos verdaderamente experimentales. Tienen una 
característica común y es que ninguno de ellos elimina las 



variables extrañas y su interés es sólo exploratorio. Pueden 
ser, básicamente, tres. 

• Una sola prueba, una sola observación. Este tipo de 
experimento es el más simple que pueda realizarse. 

Consiste en medir a posteriori el supuesto efecto de una 
variable causal. Por ejemplo, se baja un precio, se cambia el 
sabor de un producto o se incluye un anuncio en la prensa y 
posteriormente, pasado unos días se miden los resultados. 
Este diseño experimental se caracteriza por lo siguiente. 

1. Las unidades de prueba se seleccionan de forma 
arbitraria 

2. No se controlan las variables extrañas. 

3. No se puede defender su validez interna. 

4. Sólo tiene sólo interés exploratorio. 

• Un grupo con pretest y postest. Consiste en 
seleccionar un grupo, someterlo al experimento y medir los 
resultados. Por ejemplo, se selecciona un grupo de personas 
y se miden sus actitudes ante un producto antes y después 
de un anuncio. La efectividad del anuncio se mediría por los 
cambios de actitudes antes y después del experimento. Este 
diseño presenta riesgos de inclusión de variables extrañas 
como historia, maduración, efectos interactivos y 
mortalidad. Este diseño experimental se caracteriza por lo 
siguiente. 

1. Las unidades de prueba se seleccionan de forma 
arbitraria. 

2. No se controlan las variables extrañas. 

3. No se puede defender su validez interna. 



4. Sólo tiene sólo interés exploratorio. 

• Comparación estática de grupos. Consiste en 
seleccionar dos grupos de forma no aleatoria. Uno de ellos 
se somete al experimento y el otro, que recibe el nombre de 
grupo de control, no. Los resultados del experimento se 
miden a través de la diferencia entre los efectos observados 
entre el grupo sometido al experimento y el de control. Por 
ejemplo, podrían formarse dos grupos: uno podría ver un 
anuncio y el otro no. La eficacia de la comunicación se 
mediaría por la diferencia de actitudes ante la marca o el 
nivel de compra entre los grupos. Este diseño experimental 
tiene las siguientes características. 

1. Las unidades de prueba no se seleccionan de forma 
aleatoria. 

2. Los dos grupos no son forzosamente comparables, pues 
puede que sus integrantes no tengan el mismo interés en 
colaborar. 

3. No se controlan las variables extrañas. 

4. Sólo tiene interés exploratorio. 

5. Puede tener validez interna. 

4.5.3. Diseños experimentales 

En ellos, según su diseño, se pueden eliminar algunas o 
todas las variables extrañas. 

• Diseño de grupos de control pretest-postest. En 

ellos se selecciona de forma aleatoria las unidades de 
prueba, que se asignan también de forma aleatoria, bien al 
grupo experimental o al de control. Previamente se 
procedido a tomar una medida de referencia en cada uno de 



ellos. Por ejemplo, una empresa que desee medir la 
efectividad de un anuncio puede seleccionar una muestra 
de personas de forma aleatoria. La mitad de esa muestra 
servirá para ser sometida a la exposición del anuncio, 
mientras que la otra mitad no será expuesta a él. Antes de 
comenzar el experimento ambas muestras podría opinar 
sobre el producto o marca que será objeto del anuncio. 
Posteriormente, la mitad seleccionada de la muestra será 
expuesta al mensaje. Finalizado el experimento se vuelve 
recoger la opinión de los grupos a través de un cuestionario. 
Al final se tienen cuatro mediciones: dos del grupo sometido 
al experimento y otros dos del grupo de control. 
Gráficamente se puede explicar así, 

GE: R1 ^R2 

GC: R3 ^R4 

Significa que el grupo experimental (GE) proporciona la 
respuesta R1 antes del experimento y R2 después de él. El 
grupo de control (GC) proporciona la respuesta R3 antes de 
que el grupo experimental sea sometido al experimento y 
R4 después de que aquél haya sido objeto de la 
experimentación. 

El efecto del experimento se puede medir, 

(R2 - Rl)-(R4 - R3) 

Este diseño experimental controla la mayoría de las 
variables extrañas. La selección aleatoria elimina el sesgo 
de selección de unidades muéstrales. Los demás efectos 
extraños se controlan, excepto el efecto interactivo, 

R2 - Rl = efecto de experimento + efecto interactivo + 
efecto principal + historia + maduración + instrumentación 
+ regresión + mortalidad 



Como en el grupo de control no ha habido experimento no 
puede aparecer efecto interactivo. Siempre que se hace una 
medición y otra posterior puede aparecer efecto principal y 
en el grupo de control puede aparecer, luego 

R4 - R3 = historia + maduración + instrumentación + 
efecto principal + regresión + mortalidad 

En consecuencia, (R2 - Rl) - (R4 - R3) = efecto del 
experimento + efecto interactivo. 

Es decir, en este tipo de experimento se eliminan las 
variables extrañas excepto el efecto interactivo, debido a 
que el efecto de la primera medición, antes del experimento 
provoca reacciones en el grupo experimental. Sin embargo, 
si el experimento se desarrollara dentro de un intervalo de 
tiempo corto, es posible que no aparezca el efecto 
interactivo, y se este diseño experimental podría eliminar 
todas las variables extrañas. 

Cuadro 4.1. Características de los experimentos 

Clase Características 

• Emplean muestras pequeñas 

• Las muestras no son aleatorias 


Experimentos 

de 

laboratorio 


• Suelen formar parte de investigaciones 
exploratorias 

• Tienen carácter cualitativo 


Una prueba - • 
una 


Los resultados no se pueden generalizar 

No se pueden aislar las variables extrañas 
No tiene validez interna 



• No elimina las variables extrañas 

• Sólo tiene interés exploratorio 

• Puede tener validez interna 

• No elimina las variables extrañas 

• Sólo tiene interés exploratorio 

• Puede tener validez interna 

• No elimina las variables extrañas 

• Sólo tiene interés exploratorio 

• Tiene validez interna 

• Elimina todas las variables extrañas 
menos el efecto interactivo 

• Posiblemente tenga validez externa 

4.5.4. Diseños experimentales estadísticos. 

La experimentación comercial 

La experimentación comercial se puede definir como la 
creación de unas determinadas condiciones para medir sus 
probables efectos sobre una variable que se supone 
dependiente de aquellas. 

En el cuadro 4.2 se muestran las ventas de un producto 
para cuatro niveles de precios, 100, 105, 110 y 115, y en 
tres mercados: Madrid (M), Barcelona (B) y Valencia (V). La 
cuarta columna muestra el total de ventas del producto para 
cada precio. 

Tras examinar el total de ventas para cada precio un 
analista podría concluir que a medida que éste aumenta 


Observación 


Grupo con 
pretest y 
postest 

Comparación 
estática de 
grupos 

Diseño de 
grupos de 
control 
pretest- 
postest 




disminuye la cantidad demandada. 

Klimage 

Podría aplicar regresión minimocuadrática y estimar el 
siguiente modelo, cuyo poder explicativo es muy elevado, 
pues es 0,98. 

Q = 569 - 1,7 P 

r2 = 0,98 

Sin embargo, se aprecia algo extraño en la tabla. En Madrid 
para un precio de 100 se venden 200 unidades, y 90 
cuando el precio sube a 105. Esto parece lógico. No 
obstante, si el precio sube a 110 la cantidad demandada es 
de 300, mucho mayor que la obtenida para un precio de 
100. En Barcelona la situación es todavía más extraña. Para 
un precio de 100 no hay demanda. A medida que aumenta 
el precio se producen altibajos. Tal vez Valencia sea el 
mercado «más normal». 

Veamos qué sucede cuando se estiman funciones de 
demanda en cada mercado. 

QM = 56 - 1,2 P 

r2 = 0,008 

QB = -646 + 6,8 P 

r2 = 0,327 

QV= 1160 - 9,70 P 

r2 = 0,75 


Los resultados son decepcionantes. La función de dennanda 
de Madrid no explica nada. En Barcelona el signo del 
coeficiente del precio es positivo, cuando el esperado debe 
ser negativo, dada la relación inversa entre precio y 
cantidad que cabe esperar en una función de dennanda. 
Tratándose de Valencia las cosas no son tan nnalas, aunque 
tannpoco son buenas. 

El analista debería hacerse la siguiente pregunta: si no 
existen funciones de dennanda parciales, ¿cónno es posible 
que se haya encontrado una función de dennanda global? 
Sería conno construir una pared de ladrillos sin ladrillos. 

Examinemos el cuadro 4.3 . Obsérvese en ella que las cifras 
de ventas totales coinciden con las que figuran en el cuadro 
4.2 . En cualquiera de las tres ciudades las ventas 
disminuyen a medida que los precios aumentan. Además, la 
evolución de las ventas en Madrid y Barcelona es muy 
parecida. Dado un precio cualquiera, las ventas de Valencia 
son superiores a las de Madrid o Barcelona. 

t^image 

Las funciones de demanda parciales, con los nuevos datos, 
para las tres ciudades en este caso son: 

QM = 172 - 0,42 P 

r2 = 0,969 

QB = 178 - 0,48 P 

r2 = 0,993 

QV= 219 - 0,80 P 

r2 = 0,952 




Lógicamente, la función de demanda global es la misma que 
la estimada con los datos de la tabla 4.1. Obsérvese que si 
se suman los términos constantes de las funciones de las 
tres ciudades a partir de los datos de la tabla 4.2, se obtiene 
el valor de la constante de la función de demanda global, 
569. La suma de los coeficientes del precio es 1,7; el de la 
función de demanda global. 

La función de demanda para todo el mercado es la suma de 
las funciones de demanda parciales de las tres ciudades. Sin 
embargo, esto sólo sucede con los datos de la tabla 5.2, 
pues sólo en este caso se obtienen verdaderas funciones de 
demanda individuales. 

Todo lo expuesto conduce a concluir que en el primer caso, 
en la tabla 4.1, no existe relación causa efecto entre el 
precio y las cantidades demandadas. La relación inversa 
observada ha sido fruto de la casualidad. Por el contrario, en 
la tabla 4.2 existe una relación causa efecto. Existe una 
función de demanda global, que relaciona de forma inversa 
precio y cantidad, y que es la suma de las funciones de 
demanda parciales obtenidas en cada mercado. 

La pregunta pertinente en este momento es: ¿dónde se 
encuentra la frontera entre lo causal y lo casual?, o ¿qué 
herramienta es posible aplicar para discernir entre el azar y 
la causalidad? La respuesta es sencilla: esa herramienta se 
llama análisis de la varianza. 

4.5.4.1. Los experimentos totalmente al azar 

El análisis de varianza es una técnica estadística que 
permite discernir el efecto que sobre la variable 
dependiente ejerce un solo factor controlado, del efecto de 
otros factores no controlados. Permite contrastar la 
influencia de un factor sobre unos resultados. Es como una 



regresión con variables explicativas cualitativas. El método 
consiste en: 

- Descomponer la dispersión total de una tabla de datos en 
suma de dispersiones parciales, correspondientes a fuentes 
distintas. 

- En segundo lugar se calculan las varianzas y se comparan 
entre sí mediante un contraste F de Snedecor. 

Supongamos que se desea conocer el efecto del precio 
sobre la cantidad demandada. Cuando un experimento sólo 
controla una variable recibe el nombre de experimento 
totalmente al azar. Este tipo de experimento se emplea 
cuando se considera que existe un único factor que es 
influyente. En este caso se prueban distintos niveles de 
precios. 

Por convenio el factor que se controla se recoge en filas. Así, 
cada una de las 1, 2, ... i filas recoge un nivel de factor 
principal; un precio distinto. 

Cada una de las columnas es una unidad de recogida de 
información. Puede ser una tienda o un mercado. La 
siguiente tabla ilustra estas ideas: 

Klimage 

Cada una de las 1, 2, 3, ... i filas recoge un nivel de factor. 
Cada una de las j columnas es una unidad de recogida de 
información. Cada cifra xy corresponde a la observación del 

factor i en la unidad de recogida de información j. En este 
caso, las ventas efectuadas al precio i en el establecimiento 

j- 

La identidad fundamental es que la dispersión total de una 
matriz de i filas y j columnas es igual a la suma de la 


dispersión dentro de los grupos nnás la dispersión entre los 
grupos: 


ti II II 


Dispersión total = Dispersión dentro grupos + dispersión 
entre grupos. 

La tabla siguiente muestra las cantidades vendidas para dos 
precios en dos mercados: 

MI M2 

P1 1 3 
P2 2 4 

La dispersión total se mide por el cuadrado de la diferencia 
entre cada valor de la tabla y la media de los valores. En 
este caso: 

Dispersión total = (1 - 2,5)^ + (3 - 2,5)^ + (2 - 2,5)^ + (4 - 
2,5)2 = 5 

La dispersión dentro de los grupos es igual a la suma de los 
cuadrados de las diferencias entre cada valor (1 y 3) y la 
media del grupo (1 + 3)/2 -tratándose del primer grupo- y 
de (2 y 4) y la media (2 + 4)/2 cuando se trata del segundo. 
Es decir, la dispersión dentro de los grupos es: 

(1 - 2)2 + (3 - 2)2 + (2 - 3)2 + (4 - 3)2 = 4 

La dispersión entre grupos es la diferencia entre la 
dispersión total y la dispersión dentro de los grupos. En este 
ejemplo toma un valor igual a la unidad. 




La fórmula anterior puede desarrollarse y demostrarse 
formalmente, pero no merece la pena. Bastará con creerlo. 

Lo importante es saber lo que significan las dispersiones. 

La dispersión dentro de los grupos es un indicador de su 
homogeneidad. Si es muy grande significa que se trata de 
grupos heterogéneos. La dispersión entre grupos indica si 
existen diferencias entre los grupos. 

Por ejemplo, si elegimos tres grupos de estudiantes: de 
primero de preescolar, de cuarto de ESO y de cuarto curso 
de carrera, la dispersión de edades dentro de cada grupo 
será pequeña, pero la dispersión entre grupos será muy 
grande. En primero de preescolar los «estudiantes» tienen 
cuatro años; en cuarto de ESO quince y en cuarto de carrera 
veintidós. Los grupos son muy homogéneos en sí, pero 
heterogéneos entre sí. La dispersión total queda explicada 
por el nivel de curso que se está considerando. La fuente de 
variación de edad son los cursos. La dispersión dentro de 
cada grupo es muy pequeña, pero la dispersión entre 
grupos es muy grande. 

Estamos ya en disposición de definir dos conceptos: 
dispersión factorial y dispersión residual. A la 

dispersión entre los grupos se la llama dispersión factorial y 
a la existente dentro de cada grupo se la llama dispersión 
residual. 

En los experimentos interesa encontrar dispersiones 
factoriales muy grandes y dispersiones residuales muy 
pequeñas o nulas. Si así fuera significaría que la variabilidad 
de los datos o resultados sería la consecuencia del factor o 
variable que se esté controlando. Por ejemplo, si una 
empresa fijara varios precios podría encontrarse con estas 
dos situaciones. 



Klimage 

En esta tabla, la dispersión dentro de cada grupo es mínima. 
Para cada precio las ventas son casi idénticas en cada 
unidad de recogida de información (I, II o III). La dispersión 
dentro de cada grupo (residual) es casi nula. La dispersión 
digna de consideración es la que existe entre grupos 
(factorial) y es debida al precio, que es factor que la 
empresa controla (lo modifica) en el experimento. A simple 
vista parece que el precio tiene un efecto causal sobre las 
ventas. 

Si para los anteriores precios los resultados hubieran sido 
estos: 
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La dispersión ahora debe ser bastante mayor que la 
obtenida en el cuadro cuadro 4.4. Sin conocer todavía la 
técnica de análisis de la varianza es difícil hacer pronósticos 
sobre el efecto causal del precio. 

Calcular las dispersiones es muy engorroso. A continuación 
se exponen unas fórmulas que permiten ahorrar mucho 
tiempo. La dispersión total, con ij-1 grados de libertad, se 
calcula: 

Klimage 

La dispersión factorial, i -1 grados de libertad, se estima: 
Elimage 

Dispersión residual = Dispersión total - Dispersión factorial 
con (N-1) - (i - 1) grados de libertad. 


Conocidas las dispersiones: 



- Si se divide la dispersión factorial entre el número de 
alternativas del factor menos uno (i - 1) (n^ grados de 
libertad), se obtiene la varianza factorial. 

- Si se divide la dispersión residual entre el número de filas 
por columnas menos el número de alternativas del factor (N 

- i) (n 2 grados de libertad) que se controla, se obtiene la 
varianza residual. 

- Se formula la hipótesis nula: Hq, el factor no influye. 

- El cociente entre la varianza factorial y la residual se 
compara con el valor de la F de Snedecor con n^ grados de 
libertad en el numerador y 02 en el denominador. 

- Una vez elegido un nivel de significación, generalmente 
un 5%, si el estadístico F es mayor que el que aparece en 
tablas se rechaza la hipótesis nula. 

Ilustremos estas ideas con los datos del cuadro 4.4 . 

La dispersión total, según la fórmula que se ha expuesto, es 
igual a la suma de los cuadrados de cada uno de los valores 
obtenidos menos el cuadrado de suma dividido entre el 
número de sumandos. Es decir: 

Klimage 

A partir de estos datos se construye el cuadro 4.6 para 
estimar las varianzas y hacer el contraste. 

Klimage 

Ahora es necesario formular la hipótesis nula: Ho = {el 
precio no tiene influencia sobre las cantidades vendidas}. 




Si el estadístico F obtenido fuera mayor que el valor en 
tablas de una distribución Fcon n^ grados de libertad 
(número de factores - 1) en el numerador y 02 (total de 

valores-total de factores) grados de libertad en el 
denominador, se rechazaría la hipótesis nula, dado un nivel 
de significación, generalmente del 5%. 

En este caso F con 3 grados de libertad en el numerador y 8 
en el denominador vale 4,07. Como el estadístico vale 
4001,25 se rechaza la hipótesis nula. Dicho con otras 
palabras, las variaciones en las ventas en la tabla 5.3 no son 
fruto del azar, es decir, el precio afecta significativamente a 
las ventas, es un factor causal de las mismas. 

Veamos qué sucede con la tabla 5.4. 

t^image 

A partir de las dispersiones y grados de libertad se estiman 
las varianzas y el estadístico F. 

Kimage 

Debido a que el estadístico F es inferior al valor en tablas 
(4,07), no se puede rechazar la hipótesis nula. El precio no 
afecta a las ventas, no es un factor causal en este caso. 

En resumen, las fórmulas que deben aplicarse son las 
siguientes: 

Dispersión total: K¡¡mage 
Elimage 


Donde: C recibe el nombre de término de corrección 
^ij es cada uno de los elementos de la tabla 
^t es la dispersión total 


Df es la dispersión factorial 

X¡ es la suma de los valores para cada nivel de factor 

j es el número de sumandos para cada nivel de factor 
N es el total de observaciones (i x j). 

4.5.4.2. Experimento por bloques aleatorios 

En ocasiones una empresa puede llevar a cabo 
experimentos controlando dos factores. En estos casos se 
habla de experimentos por bloques aleatorios. Uno de ellos 
recibe el nombre de factor principal. El segundo factor se 
recoge en columnas y se llama factor de rodeo. 

Por ejemplo, una empresa podría estar interesada en 
conocer si el precio de su producto y el mercado donde se 
comercializa afectan a las ventas. Para ello podría llevar a 
cabo un experimento por bloques aleatorios. El factor 
principal que se considera es el precio, aparece en filas y el 
secundario o de rodeo, el mercado, en columnas. Que un 
factor se coloque en filas o en columnas no afecta a su 
influencia, que se determinará a partir del análisis de la 
varianza. 

En el cuadro 4.8 se recogen las ventas efectuadas en los 
distintos mercados para cada nivel de precios; se han 
vendido 200 unidades en Madrid a un precio de 1 €. Cuando 
ascendió a 1,05, las ventas descendieron a 90 unidades. Las 
demás casillas se interpretan de forma análoga. 

Las fórmulas para analizar los experimentos por bloques 
aleatorios son la siguientes: 
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Klimage 



Kümage 

Dispersión residual: = Dj- - Df - Dccon ij-i-j + 1 grados de 
libertad. 

Donde: C recibe el nombre de término de corrección 
Dj- es la dispersión total. 

Df es la dispersión de las filas. 

De es la dispersión de las columnas. 

Dr es la dispersión residual. 

X¡ es la suma de los valores para cada nivel de factor por 
filas. 

Xj es la suma de los valores para cada nivel de factor por 
columnas. 

i es el número de niveles de factor por filas (número de 
filas). 

j es el número de niveles de factor por columnas (número de 
columnas). 

X es la suma de todas las observaciones. 

N es el total de observaciones (i x j). 

Klimage 

Según los datos el término de corrección C es igual a: 
Elimage 

La dispersión total es: 

Kimage 

La dispersión debida al precio (por filas) es: 

Klimage 

La dispersión por mercados (en columnas) es: 


Kümage 

La dispersión residual es: 

56.945,832 

Dividiendo cada dispersión entre sus grados de libertad se 
obtienen las varianzas de las filas (precios) y de las 
colunnnas (nnercados o ciudades). Un paquete estadístico 
proporciona directamente la tabla siguiente: 
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Las hipótesis nulas que se formulan son las siguientes: 

- Ho = {el precio no influye sobre las ventas}. 

- H'o = {el mercado no influye sobre las ventas}. 

Los valores en tablas para unos niveles de significación del 
5% con 3 y 2 grados de libertad en el numerador y 6 en el 
denominador son F = 9,28 y F = 19,20. 

Como los estadísticos obtenidos son mucho menores que los 
valores en tablas, se concluye que no se pueden rechazar 
las hipótesis nulas. Esto es, el precio y el mercado no son 
factores que afectan a las ventas, siendo éstas fruto del azar 
o de otras variables no controladas en el experimento. 

Si precio y mercado no son factores causales, no tiene 
sentido obtener una función de demanda que asocie 
cantidades y precios por mercados. Recuérdese que 
aparentemente existe una relación inversa entre precio y 
cantidad total vendida en los tres mercados, pero esa 
relación es espúrea, casual. El precio no influye en las 
ventas. Veamos qué sucede con los datos del cuadro 4.10 . 
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Según los datos, el término de corrección C es igual a: 
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La dispersión total es: 

Klimage 

La dispersión debida al precio (por filas) es: 

Elimage 

La dispersión por mercados (en columnas) es: 

Klimage 

La dispersión residual es: 

244,25 - 122,917 - 108,50 = 12,833 

Dividiendo cada dispersión entre sus grados de libertad se 
obtienen las varianzas de las filas (precios) y de las 
columnas (mercados o ciudades). Los resultados aparecen 
en el cuadro 4.11 . 
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Las hipótesis nulas que se formulan son las siguientes: 

- Ho = {el precio no influye sobre las ventas}. 

- H'o = {el mercado no influye sobre las ventas}. 

Los valores en tablas para unos niveles de significación del 
5% con 3 y 2 grados de libertad en el numerador y 6 en el 
denominador son F = 9,28 y F = 19,20. 



Como 19,156 > 9,28 y 25,364 > 19,20, se rechazan las 
hipótesis nulas. Se puede considerar que los mercados y los 
precios son factores causales de las ventas. Tiene sentido 
modelizar las relaciones precio-cantidad en cada mercado. 

4.5.4.3. Experimento en cuadrado latino 

Los experimentos comerciales se pueden hacer con tres 
variables bajo control. En este caso se habla de experimento 
en cuadrado latino, pues opera con matrices cuadradas. Un 
experimento de esta clase se diseña así: 

En primer lugar debe crearse una matriz de efectos, que 
debe ser ortogonal. Los efectos pueden ser cualquier 
variable que una empresa desea controlar; por ejemplo, 
precios, promociones, días de la semana, mercados, etc. La 
siguiente matriz es ortogonal: 

abe 
b c a 
c a b 

pues ninguna de las letras aparece más de una vez en su 
fila y en su columna. Esas letras podrían significar, por 
ejemplo, a = jueves, b = viernes y c = sábado. 

La matriz ortogonal se superpone sobre otra en la que 
figuran otros dos factores bajo control; por ejemplo, 
promociones y tipos de establecimiento. 

La superposición de las dos matrices da origen al diseño del 
experimento. 
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I, II y III son los niveles o variantes de promociones. Por 
ejemplo, I podría significar un reducción en el precio de un 
5%; II podría ser un descuento del 10% y III una rebaja del 
15%. MI, M2 y M3 podrían ser Madrid, Sevilla y Burgos, por 
ejemplo. No importa si las promociones figuran en filas o en 
columnas y lo mismo puede decirse de los mercados. El 
análisis de la varianza mostrará si los resultados permiten 
proponer relaciones causales entre éstos y las variables que 
se controlan. 

La casilla (1) recogerá los resultados de una promoción 
consistente en una reducción del precio de un cinco por 
ciento en Madrid un jueves. La casilla (2) medirá el 
resultado de una rebaja del precio de un 10% en Sevilla un 
sábado. 

La empresa que lleva a cabo el experimento podría haber 
optado por otra matriz ortogonal, por ejemplo: 

c b a 
b a c 
a c b 

y haber cambiado filas por columnas: 
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Ahora la casilla (1) medirá las ventas en Madrid con un 
rebaja del cinco por ciento en sábado. 

Como puede apreciarse, las posibles matrices ortogonales 
son muchas. Sin embargo, las empresas deben optar por 
una cualquiera y diseñar el experimento conforme a ella. 

Si hubiera optado por esta última, la empresa tendría que 
haber desarrollado sus promociones en los términos 


indicados por la matriz. Debería hacer descuentos del cinco 
por ciento en Madrid los sábados, en Sevilla los viernes y en 
Burgos los jueves (columna 1). 

Los descuentos del 10% (columna 2) los haría en viernes en 
Madrid, en jueves en Sevilla y los sábados en Burgos. Las 
rebajas del 15% (columna 3) tendrían lugar en Madrid los 
jueves, en Sevilla los sábados y los viernes en Burgos. 

Supongamos que los resultados han sido los siguientes: 
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Las fórmulas para calcular las dispersiones son las 
siguientes: 

Dispersión total: Dt= X (x¡j)^ - C con i.i -1 grados de 
libertad. 

Dispersión de las filas: Df = X (X¡^)/ i - C con i - 1 grados de 
libertad. 

Dispersión de las columnas: D^= X (Xj^j/i - C con i - 1 
grados de libertad. 

Dipersión de las letras: D| = X (X|^)/i - C con i - 1 grados de 
libertad. 

Dispersión residual: D= D- Df - D - D| con i - 1 grados de 
libertad. 

Elimage 

Donde: C recibe el nombre de término de corrección, 

Dj- es la dispersión total, 

Df es la dispersión de las filas. 


D(- es la dispersión de las columnas, 

D| es la dispersión de las letras, 

□r es la dispersión residual, 

X¡ es la suma de los valores para cada nivel de factor por 
filas, 

Xj es la suma de los valores para cada nivel de factor por 
columnas, 

X| es la suma de los valores para cada letra, 

i es el número de niveles de factor por filas, por columnas y 
por letras, 

N es el total de observaciones. 

De acuerdo con la tabla, las dispersiones son: 

Dt = I (x¡j)2 - C = 1602 + 3502 + 200^ + ... + 250^ - 
2190^/9 = 84.600 con 3-1 grados de libertad. 

Df = I (X¡2)/i - C = (7102 + 7302 + 7502)/3 - 21902/9 = 
266,667 con 3-1 grados de libertad. 

De = I (Xj2)/i - C = (3902 + 10502 + 7502)/3 - 21902/9 = 
72.800 con 3-1 grados de libertad. 

Para calcular la dispersión de la letras es necesario conocer 
los totales de ventas relacionados con cada una de ellas. 
Para ello se suman las ventas de las casillas que tengan la 
misma letra: 

Xa = 200 + 300 + 100 = 600 
Xb = 350 + 130 + 250 = 730 


Xc = 160 + 300 + 400 = 860 



DI = I (X^iVi - C = (6002 + 7302 + 8602)/3 - 21902/9 = 
11266,667 con 3-1 grados de libertad. 

A partir de las dispersiones y grados de libertad, se puede 
construir el cuadro 4.12 . 
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Ahora las tres hipótesis nulas que se fornnulan son las 
siguientes: 

- Hq = {el mercado no influye sobre las ventas}. 

- Ho'= {la promoción no influye sobre las ventas}. 

- Hq" = {el día de la semana no influye sobre las ventas}. 

El valor F con tres grados de libertad en el numerador y 
ocho en el denominador para un nivel de significación del 
5% es 4,07. En consecuencia, se rechazan las hipótesis 
nulas relativas a la no influencia de la promoción y día de la 
semana. No puede rechazarse la hipótesis de no influencia 
del mercado. 

En consecuencia, la empresa no debe tratar de encontrar 
diferencias de comportamiento entre los mercados. No se 
tiene evidencia empírica de que los consumidores de 
Madrid, Burgos y Sevilla sean diferentes entre sí. Sin 
embargo, la empresa sí puede influir sobre sus ventas a 
base de promociones, variables en su cuantía, según el día 
de la semana, pues el análisis de la varianza los encuentra 
factores causales. 

4.5.4.4. Límites, validez y expectativas de ia 
experimentación comerciai 



La experimentación se ha revelado como una metodología 
muy eficaz para detectar relaciones causa efecto entre 
variables de muy diversa índole. Permite aislar el efecto de 
las variables que se controlan de otras no controladas. Sirve 
para explicar una variable cuantitativa a partir de variables 
cualitativas. 

La experimentación se ha aplicado en campos del saber tan 
dispares como la botánica o la economía, con buenos 
resultados. Sin embargo, también tiene sus limitaciones; 
unas son propias del método estadístico y otras provienen 
de las dificultades prácticas de su aplicación. 

• Limitaciones inherentes ai método estadístico 

La aplicación del método experimental requiere que se 
cumplan una serie de condiciones estadísticas y de 
mantenimiento de las condiciones del experimento. 

Las limitaciones de tipo estadístico son: 

• Los valores de la variable aleatoria estudiada -las ventas, 
por ejemplo- deben comportarse conforme a una 

distribución normal. 

• Los diferentes grupos de muestras tienen que tener la 
misma varianza. Eso significa que dado un factor, los 
precios, los valores de la variable para cada precio, o para 
mercado, deben tener la misma varianza. A esta condición 
se la denomina de homocedasticidad y se puede 
conseguir si las muestras son aleatorias. 

• Además de estas limitaciones o restricciones de 
naturaleza estadística, debe añadirse que, en caso de que 
se mida el efecto de más de un factor controlado, se supone 
que los efectos son aditivos. En la realidad podrían ser 
multiplicativos. 



• Dificultades de mantenimiento de las condiciones del 
experimento 

El método experimental en economía es activo y mediante 
la creación de condiciones permite medir los efectos de las 
alteraciones de las variables que se modifican. En este 
sentido recuerda al método experimental de las ciencias 
físicas. 

Además de esta limitación de la técnica de análisis, los 
diseños experimentales no son tan controlables como los 
experimentos de las ciencias naturales. He aquí algunas 
posibles fuentes de sesgos: 

• Los mercados de prueba son de difícil delimitación. Si, 
por ejemplo, en una zona urbana se modificara el precio de 
un producto para averiguar cómo afecta a las ventas, es 
posible que compradores de otras zonas acudieran a la que 
ha modificado el precio. 

• El tiempo es un factor muy importante en los 
experimentos. La duración de éstos debe realizarse a lo 
largo de un intervalo temporal que suponga constancia de 
los demás factores y de las relaciones económicas. En 
principio, los experimentos deben realizarse en el corto 
plazo. Por las mismas razones, los resultados sólo tendrán 
validez a corto plazo. Además, los diseños experimentales 
sólo pueden ser aplicados a productos que tengan una gran 
frecuencia de compra. 

• La competencia puede interferir en el desarrollo de los 
experimentos. Puede reaccionar alterando alguna variable 
de marketing y eso supone un cambio en las condiciones 
del experimento, que afectará a los resultados. 

• Por último, el método experimental en general es caro, y 
no todas las empresas están en disposición de utilizarlo. 



4.5.4.5. Las nuevas tecnologías y su impacto sobre la 
experimentación comercia! 

Hasta hace poco tiempo, para aplicar el método 
experimental en el área de marketing era necesario emplear 
datos procedentes de paneles de consumidores, y esto era 
caro y frecuentemente lento. 

Las empresas modificaban alguna variable en algún 
mercado. Los cambios reflejados en los paneles se 
analizaban mediante análisis de la varianza, y de esta forma 
podían proponerse relaciones causa efecto. 

Este proceder era, sin embargo, lento. Muchos paneles de 
consumidores recogen la información con carácter mensual. 
Un mes es un plazo de tiempo muy extenso, y a lo largo de 
él pueden cambiar las condiciones del entorno: la 
competencia puede reaccionare alterarse el mercado 
habitual. 

Los escáners permiten hoy en día llevar a cabo 
experimentos comerciales mucho más rápidos. Una cadena 
de hipermercados, por ejemplo Carrefouro Eroski, podría 
modificar los precios de los productos en diversas 
localidades y aplicar el análisis de la varianza para detectar 
relaciones causa efecto. Se podría fijar un precio en Madrid, 
otro en Valladolid, etc., y estudiar si las variaciones de los 
precios tienen algún impacto sobre las ventas. Lo mismo se 
podría hacer con promociones o con publicidad en el punto 
de venta. Estos hipermercados también podrían valorar el 
efecto del cambio de disposición del mobiliario o de la 
ubicación del producto en las estanterías, los cambios de 
horarios, etc. 

Además, los escáneres recogen la información 
inmediatamente. De forma casi instantánea se pueden 



analizar los resultados. Esto es muy importante, pues 
reduce el riesgo de que la competencia imite las acciones 
de la empresa o reaccione, alterándose así las condiciones 
del experimento. 

Adicionalmente, se puede controlar el mercado de prueba 
mucho mejor a través de las tarjetas de los clientes, 
especialmente si llevan códigos de barras que los 
identifiquen, si bien es cierto que en España estas tarjetas 
aún se encuentran en fase de introducción. 



Capítulo 5 

Diseño de cuestionarios 


5.1. Ob j etivos del capítulo. 

5.2. Concepto v funciones del cuestionario. 

5.3. Procedimiento para desarrollar un cuestionario. 

5.4. Prueba v valoración del cuestionario. 

5.5. Técnicas para realizar pre g untas difíciles. 

5.6. ; Responden bien los encuestados? 

5.7. El cuestionario piloto. 

5.8. Un e j emplo de cuestionario. 

DISEÑO DE 
CUESTIONARIOS 

5.1. OBJETIVOS DEL CAPÍTULO 

En este capítulo se expone la metodología para diseñar 
cuestionarios. Tras su lectura el lector habrá adquirido 
conocimientos sobre, 


Qué es un cuestionario y qué funciones desempeña. 























• Qué clases de información se pueden recoger en los 
cuestionarios. 

• Qué clases de cuestionarios existen, y en qué 
circunstancias se emplean. 

• Qué clases de preguntas se pueden incluir en un 
cuestionario. 

• Cómo deben formularse las preguntas. 

• Cómo se estructura un cuestionario. 

• Cómo se formulan preguntas difíciles. 

• Qué factores explican posibles errores en las respuestas 
de las personas. 

• Qué es un cuestionario piloto y para qué sirve. 

5.2. CONCEPTO Y FUNCIONES DEL 
CUESTIONARIO 

Un cuestionario es un conjunto articulado y coherente de 
preguntas para obtener la información necesaria para poder 
realizarla investigación que la requiere. Desempeña 
funciones esenciales, como, 

• Traslada el objetivo de la investigación a preguntas 
concretas que serán respondidas por las personas 
encuestadas. 

• Homogeneiza la obtención de información, porque 
todos los encuestados responden a los mismos ítems, ya que 
el cuestionario los formula a todos por igual. 



• Si su diseño, estructura, ordenación y aspecto es 
acertado, el cuestionario contribuye eficazmente a que las 
personas proporcionen información. 

• Ayuda a que el tratamiento de datos se haga más 
rápido, porque facilita las tareas de codificación de datos y 
su grabación en los equipos informáticos, especialmente 
cuando se trata de cuestionarios que se pueden leer con un 
lector óptico. 

5.3. PROCEDIMIENTO PARA 
DESARROLLAR UN CUESTIONARIO 

Para prepararlo deben darse los siguientes pasos. 
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Gráfico 5.1. Fases para desarrollar un cuestionario 

5.3.1. Decidir qué tipo de información hace 
faita 

En primer lugar, debe comenzarse por recordar los objetivos 
de la investigación y las hipótesis que se hayan formulado, 
pues son los determinantes de la naturaleza de la 
información que hace falta recoger. Es obvio actuar así, pero 
a veces es fácil que se produzca una desconexión entre 
quien decide los objetivos de la investigación y quien la 
prepara y desarrolla. Por ejemplo, 

• Una investigación cuyo objetivo fuera analizar la 
viabilidad de un producto nuevo debería medir actitudes, 
valores o preferencias. 


• Si lo que se pretendiera fuera posicionar una marca en el 
mercado habría que preguntar por los atributos percibidos, 
habría que valorarlos y habría que decidir cómo hacerlo; 
puntuándolos o asociándolos a las marcas. 

Una investigación se diseña globalmente. Se fijan unos 
objetivos de conocimiento, que determinan qué información 
debe recogerse. Paralelamente, debe seleccionarse la 
técnica idónea para tratar la información. Cada tipo de 
datos exige una técnica de análisis, y cada estudio necesita 
aplicar la técnica idónea. 

La información que debe recogerse ha de ser capaz de 
permitir aceptar o rechazar las hipótesis o conjeturas 
formuladas. Las investigaciones, como ya se ha expuesto, 
pueden ser exploratorias, descriptivas, prescriptivas o de 
seguimiento. 

La información que se puede recoger para una investigación 
se materializa en, 

• Hechos, o comportamientos objetiva e 
inequívocamente contrastables y verifícables. Por ejemplo; 
cuánto se compra de un producto, quién compra, dónde, 
etc. 

Las siguientes preguntas recogen hechos. 

¿Tiene Ud. tarjeta de crédito? [SI] [NO] 

¿Emplea Ud. su tarjeta de crédito? [SI] [NO] 

¿Utiliza Ud. los cajeros rc-n 

4. '4.- o [SI] [NO] 

automáticos? 

• Conocimientos. Una investigación puede ir 
encaminada a valorar la notoriedad de la empresa, de una 
marca, si las personas conocen un producto o un servicio 
determinado, etc. 



• Opiniones o juicios. Se pueden realizar estudios para 
conocer opiniones. Por ejemplo, qué piensan los ciudadanos 
de la política del gobierno, cómo se valora la eficacia de un 
limpiador de alfombras, cómo se percibe la calidad del 
servicio de una cadena hotelera, etc. Las siguientes 
preguntas recogen opiniones sobre motivos de queja en 
establecimientos comerciales. 

Indique el grado de importancia de los siguientes motivos 
cuando Ud. se queja de un establecimiento comercial. 
(Indique mucho, bastante, poco, nada) 

[M] [B] [P] [N] No encontré lo que buscaba 

[M] [B] [P] [N] El establecimiento es caro 

[M] [B] [P] [N] Me atendieron mal 

[M] [B] [P] [N] Las reclamaciones no se atienden 
satisfactoriamente 

• Actitudes o predisposiciones de ánimo. La 

información que se busca con los estudios de actitudes se 
refiere a lo que se piensa acerca de imagen, valoración de 
las cosas o entes y la razón de las conductas. Por ejemplo, 
se puede preguntar qué se piensa sobre las residencias para 
la tercera edad, sobre los coches eléctricos 
anticontaminantes, sobre el trabajo a tiempo parcial para 
que todo el mundo tenga empleo, las campañas antitabaco, 
la prohibición de consumo de alcohol a los conductores, etc. 

Las preguntas que aparecen a continuación pueden ser 
válidas para conocer las actitudes de la población ante 
nuevos productos y el grado de racionalidad que demuestra 
en su adquisición. 



Ud. ve con frecuencia en los anuncios productos nuevos, 
conno hornos de microondas, lectores de discos compactos, 
televisores con funciones avanzadas, etc. Con relación a 
esos productos nuevos, (Marque con x todas las opciones 
que quiera) 

[ ] Con los que tengo ahora me es suficiente. 

[ ] Los compraré cuando reponga los que ahora tengo. 

[ ] Antes de comprarlos creo que es importante preguntar a 
otras personas que ya los tienen. 

[ ] Dado el tipo de vida que llevo no me interesan los 
productos nuevos. 

[ ] Sólo me interesan aquellos que puedan satisfacer alguna 
necesidad que los actuales no cubren. 

[ ] Me tienen que demostrar que son mejores que los 
actuales. 

• Motivos o explicación de conductas concretas. 

Podría preguntarse por qué se compran coches con motor 
diesel o por qué se consumen productos congelados, etc. 
Por ejemplo, se podría preguntar, «Indique por qué compra 
Ud. Coca Cola en envase de 330 cc. Marque con X la/s 
opción/es que desee». Algunas de las posibles respuestas 
podrían ser. 

Porque, 

Es más fácil de 
almacenar en el [ ] 
trastero 

Es la que suele [ ] 
estar de oferta en 



el supermercado 
El envase es más 
resistente que el [ ] 
de plástico 

Las botellas 
grandes no me r , 
caben en la 
nevera 

• Posibles conductas futuras. Se podría preguntar si se 
consumiría, o no, un producto preparado a base de algas 
marinas, si se estaría dispuesto a ingresar, llegado el 
momento, en una residencia para la tercera edad, a qué 
partido político se votará en las próximas elecciones, etc. 
Cruzando las clases de investigaciones con la naturaleza de 
la información se pueden conseguir las siguientes 
asociaciones. 

- Una investigación exploratoria debe recoger 
conocimientos, opiniones, actitudes o posibles conductas 
futuras. 

- Las investigaciones concluyentes deben recoger 
resultados, conductas, hechos o motivos. 

Si sobre el papel no es demasiado difícil hacer estas 
distinciones, en la práctica puede resultar complicado 
diferenciar una actitud de una opinión, y predefinir el tipo 
de información que debe recogerse en cada investigación. 

Por ejemplo, una persona puede tener una actitud favorable 
hacia los motores diesel porque son más económicos en 
consumo y menos contaminantes. Es posible que su coche 
lo lleve, y que en el futuro repita esta motorización cuando 
cambie de vehículo. Sus opiniones están condicionadas por 



sus actitudes, que a su vez influirán, presumiblemente, en 
conductas futuras. 

En el breve cuestionario que aparece a continuación 
algunas preguntas recogen actitudes, otras opiniones, e 
incluso hechos. 

Con relación a la venta por correo, teletienda o por teléfono. 
Ud. cree que... (Marque con x todas las alternativas que 
quiera) 

[ ] Estas formas de venta no son fiables: es fácil que te 
engañen. 

[ ] Es mejor ver físicamente los productos en una tienda. 

[ ] Sólo compro lo que veo y toco. 

[ ] Son sistemas cómodos para comprar. 

[ ] Permiten conocer más productos. 

[ ] Ofrecen marcas desconocidas, que me hacen desconfiar. 

[ ] No te asesoran ni te aconsejan. 

[ ] En caso de reclamación no tienes garantía de que te 
atiendan. 

[ ] En caso de reclamación no sabes a quién dirigirte. 

[ ] Ofrecen cosas interesantes. 

5.3.2. Decidir ia ciase de cuestionario 

Una vez definida la naturaleza de la información que debe 
obtenerse hay que optar por un diseño de cuestionario. 



Existen diversas clases, en función del grado de concreción 
de las preguntas, el grado de autonomía para su 
cumplimentación y la naturaleza de quien lo cumplimenta. 
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Gráfico 5.2. Clases de cuestionarios 

Cuestionarios abiertos y cerrados 

La variedad de cuestionarios que se pueden elaborares muy 
amplia. Una clasificación muy operativa se deriva del grado 
de concreción de las preguntas. En este sentido se puede 
hablar de, 

• Cuestionarios estructurados o cerrados cuando todas 
las preguntas están cerradas. 

• Los cuestionarios son semiestructurados cuando se 
combinan preguntas cerradas y abiertas. 

• Los cuestionarios se llaman no estructurados o 
abiertos cuando todas las preguntas están abiertas. 

Lo más frecuente es que los cuestionarios sean 
estructurados o semiestructurados. Los cuestionarios los 
pueden cumplimentar las mismas personas que 
proporcionan la información. Otras veces se leen las 
preguntas y los encuestadores o entrevistadores marcan las 
respuestas. Al primer tipo de cuestionarios se les llama 
autoadministrados. Se emplean en encuestas postales y 
en paneles. Se entregan personalmente o se envían por 
correo a quienes deban responderlos. Las personas leen las 
preguntas y los cumplimentan. Tienen el atractivo de que 
no hace falta una red de entrevistadores para recoger la 
información. Por contra, no es sencillo obtener la 
información puntualmente. 


Estos cuestionarios tienen que estar perfectamente 
diseñados; correcta y claramente redactados. También 
deben ser muy fáciles de cumplimentar. Las normas que 
deben seguirse para su diseño son las siguientes, 

• Debe enviarse una carta que explique lo que se espera 
del encuestado. Se explicará la finalidad de la investigación. 
Es conveniente que la carta esté personalizada. 

• Conviene explicar cómo ha sido seleccionada la persona. 

• Debe explicarse que el cuestionario es anónimo. 

• Deben proporcionarse instrucciones claras para su 
cumplimentación. 

• En lo posible deben utilizarse preguntas cerradas. 

• Las preguntas más convenientes son las dicotómicas. 

• El diseño y presentación debe ser atractivo, pues así 
aumenta la tasa de respuesta. 

La experiencia aconseja que no debe superarse las treinta 
preguntas. 

El ejemplo opuesto al cuestionario autoadministrado lo 
constituyen los cuestionarios para entrevistas 
telefónicas. Deben tener un diseño especial. Deben ser 
cortos, pues resulta difícil mantener a una persona al 
teléfono durante largo rato. Lo ideal es que sean 
respondidos en menos de diez minutos. La introducción de 
la entrevista debe hacerse rápida y eficazmente, para 
conseguir la colaboración. La voz de encuestador es muy 
importante. Las frases no deben ser largas para facilitar la 
comprensión. Es muy importante seguir un orden en la 



formulación de las preguntas, para no confundir al 
encuestado. 

En función de la naturaleza de la investigación debe optarse 
por un tipo de cuestionario u otro. A continuación se expone 
la utilidad de los mismos. 

• Cuestionarios no estructurados. Se emplean cuando 
se van a desarrollar investigaciones exploratorias. Los 
investigadores tienen conocimientos vagos sobre lo que van 
estudiar y no son capaces de dar contenido a los 
cuestionarios. Son útiles para recoger información que se 
empleará para diseñar cuestionarios con preguntas 
cerradas, o para que los investigadores se familiaricen con 
el tema que deben investigar. Se utilizan en entrevistas a 
domicilio, dinámicas de grupos y entrevistas en 
profundidad. Los cuestionarios no estructurados se 
administran a muestras pequeñas, poco representativas, no 
son susceptibles de ser tratados estadísticamente y la 
información que proporcionan es básicamente cualitativa. 

• Cuestionarios semiestructurados. Se aplican cuando 
se desea una mayor variedad de respuestas o cuando éstas 
no puedan preverse. A veces los investigadores no conocen 
la totalidad de respuestas que pueden proporcionar las 
personas, porque es muy difícil acotarlas todas, o porque no 
se tiene conocimiento suficiente. En estos casos se cierran 
las preguntas que se pueda, y se deja la posibilidad de que 
las personas añadan alguna respuesta. Se emplean en 
entrevistas personales y, ocasionalmente, en entrevistas por 
teléfono. 

• Cuestionarios estructurados. Se utilizan en 
investigaciones concluyentes; descriptivas y causales. Por 
ejemplo, para medir la imagen de empresas, detectar un 
posicionamiento de productos, segmentar un mercado con 



variables demográficas o beneficios buscados. Estos 
cuestionarios emplean escalas, y se analizan con técnicas 
cuantitativas univariantes y multivariantes. Generalmente, 
las personas que los cumplimentan han sido seleccionadas 
aplicando alguna técnica de muestreo. Se emplean cuando 
se va obtener información proporcionada por más de 50 
personas, por exigencias de cumplimiento de algunas 
hipótesis estadísticas, que requieren unos tamaños 
muéstrales mínimos. Para utilizar cuestionarios 
estructurados es necesario que se puedan prever las 
respuestas con bastante exactitud. Se emplean en 
encuestas en la calle, en casa, en establecimientos, por 
teléfono o cuando deban ser cumplimentados por el propio 
encuestado. 

El cuestionario estructurado es fácil de responder. Es el tipo 
ideal de cuestionario autoadministrado. Debe estar probado 
y depurado tras una serie de ensayos piloto. Se procura que 
su redacción sea sencilla, inequívoca y que las escalas y las 
categorías se adapten al nivel cultural y de inteligencia de 
las personas que proporcionarán la información, así como a 
otras características de ellas, derivadas de edad, subcultura, 
etc. Por ejemplo, las escalas multiítem con más de cinco 
categorías son muy complicadas para las personas mayores 
o muy jóvenes. Ocurre lo mismo con las métricas continuas. 

Cuadro 5.1. Clases de cuestionarios según el grado 
de concreción de las preguntas 

Cuestionarios Cuestionarios Cuestionarios 

abiertos semicerrados cerrados 

Su fin es obtener Su fin es medir Su fin es medir 

información hechos, actitudes, hechos, actitudes, 

cualitativa o conductas, conductas, 

diseñar preferencias, etc. preferencias, etc. 

cuestionarios que 



más adelante se 
cerrará 

Se emplean en 

investigaciones 

exploratorias 

No contienen 
escalas 

No se emplean 
técnicas de 
muestreo 

Se administran con 
presencia física de 
un investigador 


Se emplean en 
entrevistas y en 
dinámicas de 
grupos 


La información se 
analiza 

cualitativamente 

No tiene sentido 
inferir resultados 


Se emplean en 

investigaciones 

exploratorias 

Contienen escalas 

Se emplean 
técnicas de 
muestreo 

Pueden 

administrarse con 
presencia física de 
un investigador o 
ser 

autoadministrados 


Se emplean con 

fuentes primarias 

estáticas: 

encuestas 

personales, 

telefónicas y 

postales 


La información se 
analiza 

cualitativamente 

Se pueden 
generalizar los 
resultados 


Se emplean en 
investigaciones 
descriptivas y 
causales 

Contienen escalas 

Se aplican técnicas 
de muestreo 

Pueden 

administrarse con 
presencia física de 
un investigador o 
ser 

autoadministrados 

Se emplean con 
fuentes primarias 
estáticas: 
encuestas 
personales, 
telefónicas, 
postales y con 
fuentes dinámicas: 
paneles y 

encuestas ómnibus 
La información se 
analiza 

cuantitativamente 

Se pueden 
generalizar los 
resultados 



Fuente: Elaboración propia. 

Cuestionarios dirigidos a personas o a empresas 

• Cuestionarios dirigidos a personas físicas. Se diseñan 
siguiendo las normas generales expuestas en este capítulo. 
No se insistirá más ello. 

• Cuestionarios a empresas. En el caso de las empresas 
los encuestados son quienes opinan en calidad de 
representantes de las mismas. Las personas que 
proporcionan información pueden ser muy diversas. Por 
ejemplo, el Director de Compras de una gran empresa 
tendrá un perfil muy distinto al responsable de las mismas 
en una empresa pequeña. Las compras serán diferentes en 
volumen y frecuencia. Por todo ello se deduce que siendo 
tan distintas las empresas resulta imposible diseñar un 
cuestionario que sea válido para todas. Sin embargo, 
pueden seguirse unas normas generales para la 
elaboración de cuestionarios a empresas. 

1. Debe dejarse una cabecera para identificar la empresa en 
función de sus características. 

2. Conviene emplear también preguntas abiertas, dada la 
heterogeneidad de empresas y respondientes, y su alta 
cualificación. 

3. Las personas que responden a las encuestas suelen tener 
una elevada formación. No debe tenerse reparo en formular 
preguntas complejas. 

5.3.3. Dar contenido a las preguntas 

El cuestionario debe estar cuidadosamente elaborado en 
contenido y forma para recoger la información necesaria 



para llevar a cabo correctamente la investigación que se 
desarrolla. Además, debe estar redactado de forma que 
facilite su cumplimentación y permita obtener una tasa 
elevada de respuesta. En su diseño ha de definirse la 
codificación de las preguntas más adecuada para su 
tratamiento posterior. 


5.3.3.1. Clases de preguntas 


Los tipos de preguntas que pueden hacerse se pueden 
agrupar en diversas categorías, en función de diversos 
criterios de clasificación, que se recogen el cuadro 5.2 y se 
detallan con posterioridad a él. 

Cuadro 5.2. Clases de preguntas 


Criterio de clasificación 


Cantidad de respuestas y su 
relación 


Fines de las preguntas 


Forma de realizarse 


Clases de preguntas 

• Abiertas 

• Cerradas 

• Semicerradas 

• Dicotómicas 

• Respuesta múltiple 

• Baterías de 
preguntas 

• Filtro 

• Control 

• Directas 

• Indirectas 


Libertad de elección de respuestas 


Fryer?fe.-Elaboración propia. 




Por la libertad de elección de respuestas 

• Preguntas abiertas. En ellas el encuestado responde 
libremente. Este tipo de preguntas se emplea en las fases 
previas a la elaboración de un cuestionario cerrado. Sirve 
para encontrar posibles actitudes, motivaciones, opiniones, 
etc. También se emplean en entrevistas en las que las 
personas por sus características puedan dar una 
información muy rica en matices. Las respuestas son más 
espontáneas y, seguramente, más valiosas que las 
proporcionadas por preguntas con alternativas de 
respuestas cerradas, pero su análisis es más complicado y 
costoso. 

Las preguntas abiertas suelen utilizarse para preparar 
cuestionarios cerrados y elegir las modalidades de 
respuesta. Sin embargo, las preguntas abiertas no son 
recomendables con personas de nivel cultural o intelectual 
bajo. 

Por ejemplo, en la preparación de un cuestionario definitivo 
sobre hornos de microondas se podrían distribuir algunos 
cuestionarios -previos- con una pregunta abierta, entre 
otras, en la que se preguntara ¿Qué ventajas encuentra Ud. 
en el uso del horno de microondas? Indique las que le 
parezcan oportunas. Tras el examen de los cuestionarios el 
investigador encontraría respuestas como rapidez, limpieza, 
cocina más sana, etc. que le servirían para diseñar un 
cuestionario con preguntas cerradas. Un problema que 
puede surgir es que existan demasiadas alternativas y eso 
plantee dificultades para cerrar el cuestionario, ante el 
número excesivo de posibles respuestas. 

• Preguntas cerradas. En ellas las alternativas de 
respuesta están limitadas. El encuestado marca una, o 
varias, de las alternativas que se le ofrecen. Las preguntas 



cerradas son útiles en cuestionarios que han de responderse 
con rapidez, o por teléfono. No hacen pensar mucho y 
resultan interesantes cuando no es necesario profundizar 
demasiado, o sólo se trata de recoger hechos, aunque 
también sirven para medir actitudes o motivaciones. Son las 
más adecuadas para personas con nivel cultural bajo, 
escasa memoria o con dificultades de comprensión. Por ser 
menos fatigosas de responder que las preguntas abiertas 
pueden formar parte de cuestionarios más largos. Por 
ejemplo, los fumadores podrían contestar a alguna de las 
siguientes modalidades, cerradas, de respuesta. 

¿Cuántos cigarrillos fuma al día?. 

Menos de cinco [] 

Entre cinco y diez [ ] 

Entre diez y . , 

veinte 

Más de un . , 

paquete 

Su codificación es inmediata y su tratamiento estadístico es 
más sencillo. No obstante, debe prestarse especial atención 
a la elección de las modalidades de respuesta, de forma que 
se contemplen todas las posibilidades y todas tengan un 
número elevado de posibles respuestas. Por ejemplo, una 
mala elección de modalidades de respuesta sería considerar 
estas posibilidades, 

¿Cuántos cigarrillos fuma al día?. 

Menos de cinco [] 

Entre cinco y 
cuarenta 

Más de cuarenta [ ] 



Porque la mayoría de los fumadores se encontrarían en la 
segunda modalidad. La pregunta no aportaría apenas 
información. 

• Preguntas semicerradas. A través de ellas se 
proporcionan alternativas de respuesta cerradas y también 
se deja la posibilidad de que el encuestado responda 
libremente a alguna de las preguntas. Constituyen un 
híbrido entre las preguntas abiertas y cerradas, con sus 
ventajas e inconvenientes. Se utiliza cuando se sabe que 
existen unas pocas modalidades que contienen la mayor 
parte de las respuestas, pero se desea una información 
exhaustiva. Así se obtiene ésta con un coste menor que el 
correspondiente a las preguntas abiertas. 

Por ejemplo, se podría preguntar, en Madrid, 

¿En qué entidad financiera tiene domiciliada su nómina? 

Ibercaja [ ] 

Banesto [ ] 

Caja ., 

Madrid ^ ^ 

Otra (especificar) 


Por la cantidad de respuestas y su relación. 

• Preguntas dicotómicas. En ellas sólo existen dos 
alternativas de respuestas, mutuamente excluyentes. Por 
ejemplo; se compra un producto o no se compra, se posee 
coche o no, etc. Las preguntas dicotómicas son fáciles de 
responder. El encuestado proporciona la información 
rápidamente y con pocas posibilidades de sesgo, siempre 
que estén correctamente formuladas. 




Una pregunta dicotómica no debería sustituir a otras 
preguntas más complejas o encadenadas. Por ejemplo, no 
debería preguntarse Conteste sí o no, ¿ayer estuvo su 
televisor conectado más cinco horas y vio una película de 
acción en TVl y un programa cultural en TV2? Esta 
pregunta debería desglosarse en tres, una por cada idea. 

• Preguntas con múltiples respuestas. Ante una 
pregunta o afirmación se proporcionan varias alternativas 
de respuesta. Por ejemplo, ante la pregunta ¿cuál de la 
siguientes actividades realiza Lid. durante su tiempo libre? 
se podría contestar (a todas las que fuera posible) 

Escucho música 
Voy al cine 
Practico el esquí 

Practico la 
escalada 
Paseo 
Hago 

submarinismo 
Hago bricolaje 
Duermo 

La pregunta con múltiples respuestas está cerrada, es 
inequívoca, fácil de responder y fácil de codificar (1, 2, 3, 4, 
5, 6, 7, 8). Sin embargo, no es adecuada para estudiar 
motivaciones. Es adecuada para conocer hechos, 
preferencias y opiniones. 

Puede suceder que el número de alternativas de respuesta 
sea demasiado corto o elevado. En el primer caso tal vez no 
se recoja toda la información que pudiera tener interés. Si 
fueran muchas las alternativas los respondientes podrían 
aburrirse. Además es posible que esta pregunta pueda tener 


[ ] 1 
[ ] 2 
[ ] 3 

[ ]4 

[ ] 5 

[]6 

[ ] 7 
[]8 



múltiples respuestas, porque una persona puede practicar 
varios deportes. En estos casos la codificación es 
complicada. En tal caso, cada alternativa se convierte en 
dicotómica para poder tabularla correctamente. 

• Preguntas en batería. Se llama así a una serie de 
preguntas relacionadas con un mismo tema, que se integran 
y complementan. En un cuestionario sobre consumo de 
bebidas alcohólicas una batería de preguntas podría ser. 

Indique qué marca de vino tinto de mesa consume 

A B C D E F G 

Indique si la consume 

En la comida [ ] 

En bares [ ] 

En la cena [ ] 


Indique dónde la compra 


En tiendas 
tradicionales 

[ ] 

En 

supermercados 

[ ] 

En grandes 
almacenes 

[ ] 

En grandes 
superficies 

[ ] 

En bares 

[ ] 

Indique cuánto consume semanalmente 


Menos de un litro [ ] 



Entre uno y dos [ ] 
litros 

Más de dos litros [] 

Por los fines de las respuestas 

• Preguntas filtro. Así se denomina a una serie de 
preguntas dispuestas de forma que se subordinen unas a 
otras. Una respuesta afirmativa o negativa a una pregunta 
excluye o requiere la siguiente. Por ejemplo, las preguntas 
en batería que acaban de exponerse sólo deberían ser 
respondidas por personas que declararan beber vino tinto. 
En alguna parte del cuestionario tendría que figurar una 
pregunta -dicotómica- formulada así 

¿Consume Ud. vino tinto! Sí[ ] No[ ] 

Esta pregunta es un filtro. Los que consumen vino tinto 
responderán a la batería de preguntas expuesta. Quienes no 
lo consuman «serán dirigidos» a otras preguntas del 
cuestionario. 

• Preguntas de control. Su misión es verificar la 
coherencia entre las respuestas proporcionadas por el 
encuestado. Una persona que no fume y que así lo constate 
en el cuestionario no puede responder posteriormente que 
consume dos paquetes de tabaco al día. Las preguntas de 
control son muy útiles para eliminar cuestionarios por 
incoherentes. 

Por la forma de realizarse 


• Las preguntas directas se formulan para obtener 
respuestas directas, sin rodeos. Una pregunta directa -y 
dicotómica- es, ¿tiene Ud. perro? S6\o cabe sí o no. Las 



respuestas a las preguntas directas pueden cerrarse en los 
cuestionarios. 

• Las preguntas indirectas se fornnulan así porque de lo 
contrario sería más difícil obtener una respuesta. Se aplican 
principios de técnicas proyectivas. Por ejemplo, se podría 
preguntar «¿qué piensa Ud. de las personas que tienen 
creencias religiosas?» La respuesta podría permitir conocer 
si la persona encuestada las tiene, o al menos cómo las 
valora. Una pregunta directa como «¿tiene Ud. creencias 
religiosas?» posiblemente daría una respuesta cuya 
credibilidad sería discutible, pues es demasiado íntima para 
ser contestada a un extraño. 

Cerrar las preguntas indirectas es difícil o incómodo, aunque 
es posible. Las preguntas indirectas generan respuestas 
muy ricas en matices, que deberían recogerse en preguntas 
abiertas. Las preguntas indirectas, por lo general, no se 
emplean en cuestionarios, sino en la aplicación de técnicas 
cualitativas proyectivas. Cuadro 5.3 muestra características 
de algunos de los tipos de preguntas que se han expuesto. 

Cuadro 5.3. Características de las preguntas 

Características 

Recoge información con un mínimo de 
indicaciones para el encuestado 

Es útil cuando la gama de respuestas es 
muy amplia 

Es más costosa de codificar, tabular y 
analizar 


Clase de 
pregunta 

Pregunta abierta 



Los encuestadores deben registrar las 
respuestas de forma textual 


Pregunta 

dicotómica 


Preguntas 

cerradas 


Los resultados dependen mucho de la 
calidad de las entrevistas 

Es fácil introducir sesgos al escribir las 
respuestas 

Es muy fácil de preguntar y de responder 

Debe asegurarse que sólo existan dos 
alternativas. No cabe el no sabe/no 
contesta 

Muchos tipos de información sólo 
admiten preguntas dicotómicas: 
hombre/mujer; rural/urbano; compra / no 
compra 

Es más difícil introducir sesgos que con 

otros tipos de preguntas 

Son fáciles de preguntar y tabular 

Suelen ser más sencillas de preguntar 
que las preguntas abiertas Hay que estar 
seguro de incluir todas las alternativas 
posibles 


Fryer?fe; Elaboración propia. 


5-J-5.2. Cómo preguntar 

La calidad de una investigación se encuentra condicionada, 
en gran medida, por lo acertado del diseño de las 
preguntas. Si éstas están mal definidas, son ambiguas, o no 
responden a los objetivos de la investigación, por muy 



bueno que sea el analista y por muchas técnicas de análisis 
de datos que conozca, llegará a unos resultados estériles. La 
investigación debe partir siempre de una fase cualitativa, en 
la que se trata de definir qué se va a preguntar y cómo se 
van a medir las respuestas. 

Preparar un cuestionario no es tan fácil como que parece. En 
líneas generales, unas reglas básicas para su confección son 
las siguientes. 

• No deben emplearse nunca palabras ambiguas. El 

cuadro 5.4 recoge una lista de palabras ambiguas y muestra 
por qué no se deben utilizar. 

Cuadro 5.4. Relación de algunas palabras ambiguas 


Palabras Por qué es ambigua 

Pueden ser obvias: ¿Todos los perros tienen 
Todo cuatro patas?, ¿Paras siempre con ei semáforo 

en rojo? 

Pueden ser imprecisas, vagas: ¿Hace Ud. todo 
Siempre lo posible para encontrar un buen precio 

cuando compra?, ¿Estás siempre contento? 

Malo La gente no suele criticar en los cuestionarios. 

Posee connotaciones políticas. Se puede 
País entender como región, estado, nación, 

comunidad autónoma. 


Diario 

Comida 


Se pueden entender como de lunes a viernes o 
de lunes a domingo. 

Se puede entender como alimento, o el 
almuerzo, a mediodía. 


Poco Mucho 
Demasiado 


Puede ser poco para algunos pero mucho o 
demasiado para otros. Por ejemplo, fumar 5 
cigarrillos. 



Fuente: Elaboración propia. 


• Las preguntas deben ser concretas si se quieren 
respuestas concretas. Por ejemplo, se podría preguntar a un 
fumador ¿cree Ud. que fuma demasiado? Esta pregunta no 
es concreta. Para algunas personas demasiado podrían ser 
10 cigarrillos; para otras, 20 ó 30, o tal vez más. El término 
demasiado es subjetivo. Sería mejor preguntar ¿cuántos 
cigarrillos fuma Ud.? El investigador obtendría así 
información objetiva. Por ejemplo. 

Fumo, 

Menos de cinco cigarrillos al r, 
día ^ ^ 

Entre cinco y diez cigarrillos 
al día ^ ^ 

Entre diez y veinte cigarrillos r , 
al día ^ ^ 

Más de un paquete diario [] 

• Deben evitarse los cálculos. Las personas encuestadas 
no deben hacer cálculos, especialmente cuando los 
cuestionarios son largos, por diversas razones; porque se 
cansan, porque se pueden confundir o porque su memoria 
no sea buena. 

• Las preguntas deben ser breves porque así se facilita su 
comprensión y se reduce el cansancio de los encuestados. 

• Las preguntas deben estar formuladas utilizando un 

vocabulario comprensible. 

• No deben hacerse preguntas que contengan 
potencialmente la repuesta. Si se deseara hacer un 
estudio sobre la visión de los conductores acerca de la 
influencia de los motores de los vehículos y la 



contaminación, la siguiente pregunta estaría mal formulada, 
pues contiene la respuesta. 

«Considerando que los motores Diesel son menos 
contaminantes, y que la legislación en materia de medio 
ambiente será cada vez más estricta, opine sobre la 
conveniencia de fomentar ia producción de» 

C^image 

Otra pregunta que contiene implícitamente la respuesta es 
«Teniendo en cuenta que el mercurio es un agente muy 
contaminante, ¿está Úd. de acuerdo con su eliminación 
progresiva en productos como las pilas o las pinturas?» 

• Las preguntas deben ser neutrales. No deben incorporar 
juicios, opiniones o valoraciones. Por ejemplo, no estaría 
bien preguntar «¿qué le parecen a Ud. ia rapidez y 
amabilidad con que le atienden en el supermercado 
Champiñón?» Debería preguntarse «¿qué opina Ud. del 
trato que le dispensan en el supermercado Champiñón?» 

• Las preguntas se formularán en términos inequívocos, 
para garantizar su interpretación. El encuestado no tiene 
que averiguar qué es lo que se le quiere preguntar. Por 
ejemplo, el Ayuntamiento de una ciudad podría estar 
considerando la conveniencia de convertir el casco antiguo 
de la ciudad en peatonal. Podría hacer un sondeo de opinión 
en la población y preguntar, 

«¿Cree Ud. que podría resultar conveniente estudiar la 
posibilidad de que, bajo ciertas circunstancias, se cerrara 
discrecionalmente y parcialmente ai tráfíco, la parte antigua 
de la ciudad para cierto tipo de vehículos que pudieran 
tener algunas características consideradas especiales?» 


Una persona a quien se le formulara una pregunta así no se 
enteraría de nada. Si pensara una posible respuesta podría 
proporcionar múltiples argumentos a una pregunta que ella 
debería esforzarse -y cómo- en interpretar. La pregunta 
debería ser, 

«¿Aprueba Ud. que se cierre definitivamente ai tráfico ia 
parte vieja de ia ciudad?» Las respuestas posibles serían: sí, 
no o indiferencia. 

• Conviene facilitar la memoria. El encuestado no debe 
esforzarse en recordar; es cansado o puede que tenga mala 
memoria. Por ejemplo, si se deseara saber cuánto pagó un 
ama de casa por un litro de aceite en su última compra no 
debería preguntarse directamente el precio. Salvo que sea 
una persona especialmente sensible a él no lo recordará. Los 
consumidores no recordamos exactamente los precios, pero 
sí intervalos dentro de los cuales se desenvuelven. La 
pregunta sobre el precio del aceite podría formularse así, 

«¿Cuánto pagó Ud. por un litro de aceite en su última 
compra?» 

Entre 1,2 € y j. , 

Entre 1,5 € y 2 € [ ] 

Más de 2 € [ ] 

Si se quisiera saber cuántas veces ha ido una persona al 
cine al año no se preguntaría «¿cuántas veces ha ido ai cine 
durante ei úitimo año?» Sería mucho más adecuado 
preguntar, «¿cuántas veces va Ud. ai cine por semana, por 
término medio?» Si contestara que dos, se deduciría que 
esa persona ve cien películas al año, aproximadamente. 



• No deben hacerse preguntas embarazosas o que 

puedan dañar la sensibilidad del encuestado. Los estados 
emocionales han de evitarse. En Estados Unidos se realizó 
una investigación, en 1959, para definir el perfil de 
compradores de dos marcas de coches; Chevrolet y Ford. 
Entre otras preguntas del cuestionario figuraba una relativa 
a las tendencias sexuales del encuestado. En una primera 
fase fueron muchas las personas que se negaron a contestar 
el cuestionario en su totalidad. Finalmente, hubo que hacer 
desaparecer esa pregunta. Esta anécdota pone de relieve la 
necesidad de desarrollar fases cualitativas para diseñar los 
cuestionarios y la conveniencia de hacer algunas pruebas 
previas a su distribución masiva. 

Desde una perspectiva menos freudiana algunas preguntas 
son también delicadas, como por ejemplo, la relativa a los 
ingresos de las personas o su edad. No debe preguntarse 
directamente la renta. Es más fácil obtener una respuesta 
cuando se formula la pregunta en los siguientes términos. 

«Por favor, indique dentro de qué tramo se encuentran sus 
ingresos anua Íes» 

Menos de 10.000 r , 

€ ^ ^ 

Entre 10.000 y . , 

15.000 € 

Más de 15.000 € [] 

Algo parecido sucede con una pregunta relativa a la edad 
de la persona encuestada. Es más fácil obtener una 
respuesta si se pregunta la edad por intervalos que si se 
pide directamente. 


5.3.4. Estructurar el cuestionario 



Un cuestionario consta de tres partes: introducción, cuerpo 
e identificadores. 

• Introducción, en la que se explica lo siguiente. 

1. Se identificará a quien haya encargado la investigación, 
salvo que éste no lo desee. 

2. Se explicará el objetivo de la investigación. 

3. Se explicará cómo se seleccionado a la persona que 
responde, para evitar recelos y conseguir colaboración. 

4. Si el cuestionario se cumplimentara cara a cara, el 
encuestador hará un valoración de la idoneidad de la 
persona seleccionada para ser encuestada, si sospechara 
que su colaboración fuera dudosa. 

• Cuerpo, o conjunto de preguntas que se van a formular. 
Este conjunto de preguntas se puede subdividir a su vez en 
preguntas de, 

1. Aproximación, que suelen ser muy sencillas, poco 
comprometidas y que generan interés en colaborar. Por 
ejemplo, ¿con qué frecuencia hace Ud. ¡a compra? Figuran 
al principio del cuestionario. A medida que se avanza en el 
cuestionario se puede aumentar el grado de complejidad de 
su formulación o contenido. Si las preguntas delicadas se 
colocan al principio la posibilidad de una negativa a 
colaborar es mayor. 

2. Transición. Se formulan antes de las preguntas 
complejas. Por ejemplo, «Hábleme de los hábitos de lectura 
de su familia». Se colocan entre las preguntas de 
aproximación y las complejas. 



3. Complejas. Requieren mucha atención, interés y juicio 
por parte de quien responde. Por ejemplo, «Proponga Ud. 
una solución al problema de la delincuencia juvenil». 

Aumentar las penas de cárcel [ ] 

Ocupar el ocio de forma 
inteligente 

Estimular el empleo para los r. 
jóvenes 

• Los identificadores del encuestado son variables 
generalmente nominales que permiten reconocer las 
características demográficas o sociodemográficas de 
quienes proporcionan la información, y que son 
fundamentales para formar grupos o identificar segmentos 
homogéneos. Deben ir al final del cuestionario. Una vez que 
se ha respondido al cuestionario, la persona que lo haya 
hecho comprende los objetivos de la investigación, y 
entenderá mejor por qué se le piden datos que la 
caractericen. Tras finalizar la recogida de información es 
más fácil que se proporcionen los identificadores relativos a 
edad, renta, estudios y actividad laboral. 

Además de lo expuesto conviene tener en cuenta dos 
aspectos más: el orden de las preguntas y el orden del 
cuestionario. 

• El orden de las preguntas no debe afectar a las 
respuestas. Esta es posiblemente la norma de redacción de 
cuestionarios más difícil de aplicar. Lo deseable es que las 
respuestas que den los encuestados no dependan del orden 
en que se formulan. Cada pregunta debería ser 
«independiente» de las anteriores. En una investigación 
sobre el medio ambiente podrían hacerse estas dos 
preguntas, entre otras. 



«El gobierno autonómico va a convertir 10.000 hectáreas de 
terreno de ia sierra en zona protegida. Indique si está de 
acuerdo, o no» 

«Considerando que las zonas protegidas tienen restringido 
el acceso y limitado el número de visitantes al año, indique 
alternativas sustitutivas de visitas a ia sierra» 

Si a una persona a quien le gustara ir los fines de semana a 
la sierra se le hicieran estas dos preguntas, en este orden, 
seguramente estaría de acuerdo con la primera, pues 
protege una zona de su interés. Pero si se formulara antes la 
segunda pregunta es posible que no estuviera de acuerdo 
con convertir la sierra en zona protegida, pues ello podría 
limitar sus visitas. 

• El orden del cuestionario deberá ser lógico. Las 
preguntas deben hacerse por temas afines y en orden de 
dificultad creciente. En una investigación sobre el gasto de 
una familia en bienes y servicios deberían hacerse grupos 
de gastos por su naturaleza; por ejemplo, alimentos, 
vestido, hogar. No deberían mezclarse las preguntas de 
estos apartados. 

Cada pregunta debe conducir a la siguiente. Por ejemplo, en 
un cuestionario dirigido a poseedores de coche el orden de 
las preguntas es lógico. 

Indique la marca .... 

Indique el modelo .... 

¿Cuantos años tiene su coche? 

Menos de uno [ ] 

Entre uno y dos [ ] 



Entre dos y cuatro [ ] 
Más de cuatro [ ] 


El mantenimiento 

Lo realiza Ud. [ ] 

Lo lleva a un servicio oficial [ ] 

Lo lleva a un taller no oficial [ ] 

Se encuentra, con su coche 

Satisfecho [ ] 

Poco satisfecho [ ] 

Insatisfecho [ ] 

Cuando cambie de coche 

Compraré otro de la misma r , 
marca 

No creo que repita la marca [ ] 

Compraré un coche de otra r , 
marca 

5.4. PRUEBA Y VALORACIÓN DEL 
CUESTIONARIO 

Una vez que se ha elaborado el cuestionario conviene hacer 
una valoración del mismo. Para ello debe darse respuesta a 
las siguientes preguntas de esta lista de comprobación. 

- ¿Responde el cuestionario a los objetivos de la 
investigación? 

- ¿Son necesarias todas las preguntas? 



- ¿Podrá el encuestado contestar a todas las preguntas? 

- ¿Querrán los encuestados contestar a todas las preguntas? 

- ¿Es fluido? 

- ¿Es de una extensión razonable? 

- ¿La secuencia de preguntas es correcta? 

- ¿Se han incluido transiciones e introducciones? 

5.5. TÉCNICAS PARA REALIZAR 
PREGUNTAS DIFÍCILES 

Cuando se trata de preguntas delicadas es difícil obtener 
respuestas sinceras, si las preguntas se hicieran 
directamente. Por ejemplo, si se preguntara a una persona si 
ha consumido drogas alguna vez, es muy probable que 
dijera que no, aunque la realidad haya sido otra. 

Si se desarrollara una investigación para conocer el 
porcentaje de población que ha consumido alguna vez 
algún tipo de droga no sería necesario conocer las 
respuestas individuales de cada persona, sino una 
estimación del porcentaje. En casos como este se puede 
acudir a la técnica de respuestas aleatorizadas, que 
garantiza el anonimato de la respuesta del entrevistado y 
asegura su colaboración. 

Para aplicar esta técnica se formulan dos preguntas 
simultáneamente. Una es delicada y la otra intrascendente. 

a) ¿Acaba su número de DNI en cuatro? 

b) ¿Ha consumido drogas en alguna ocasión? 



Antes de responderse le proporciona al encuestado el 
medio de elegir entre ambas preguntas, por ejemplo, 
lanzando un dado. Si saliera un uno o un dos, debería 
responder a la pregunta «a». En caso contrario respondería 
a la «b». 

El entrevistador no conoce el resultado del lanzamiento, y 
no sabe a qué pregunta responden los encuestados. Sólo 
conoce una respuesta; sí o no. La probabilidad de responder 
a la pregunta «a» es conocida, Pq; en este caso 2/6. La de 

responder a la pregunta «b» es 1-Po, en este caso 1-2/6, es 
decir, 4/6. La probabilidad de Sí a la pregunta a «a» es 
conocida Pa=l/10, pues son 10 las posibles terminaciones 

del DNI, todas con igual probabilidad. Sea p la proporción de 
síes obtenidos en la encuesta. La estimación de la 
proporción de síes a la pregunta «b» se calcula así, 

Klimage 

En una encuesta realizada a 1.000 personas en la 300 han 
respondido «sí» a las preguntas (a la que corresponda tras 
el lanzamiento del dado), la proporción de personas que se 
drogan se estima en, 

Elimage 

Otra técnica para hacer preguntas delicadas es proporcionar 
al entrevistado unos cartones con las respuestas 
codificadas, de forma que el entrevistado responda a cada 
pregunta únicamente con su código. Como el entrevistador 
no tiene a la vista estos códigos no identifica la respuesta. 


5.6. ¿RESPONDEN BIEN LOS 
ENCUESTADOS? 


Un cuestionario puede estar muy bien diseñado y el 
encuestador ser excelente. No obstante, siempre existe la 
duda sobre la veracidad de la información que se obtiene. 
Tres son las fuentes de incertidumbre. 

• Quien responde tiene dificultad para expresarse o 
para comprender el cuestionario. Puede ser por razones 
culturales o intelectuales. En general, los cuestionarios con 
preguntas cerradas son los más aconsejables para personas 
que tengan estas características en grado medio o bajo. 
Cuando se trata de preguntas abiertas es más difícil obtener 
respuestas, porque obligan a un ejercicio mental. A veces el 
número de ítems o de categorías en cada uno de ellos 
pueden resultar excesivos, especialmente con personas 
mayores o muy jóvenes. 

• Quien responde tiene mala memoria. Este problema 
aparece con frecuencia cuando se trata de personas de 
edad, pero también puede aparecer aisladamente en 
cualquier otra. Para conseguir información fiable se puede 
acudir a listas u otros elementos visuales (fotos, catálogos, 
etc.) que ayuden a recordar. También se puede invitar a que 
la persona escriba un diario. 

• Quien responde puede ser reacio a contestar. Las 

razones pueden ser de diversa naturaleza. Pueden ser 
inconscientes o irracionales pues tal vez el encuestado no 
pueda dar argumentos sobre su negativa a responder. Otras 
veces pueden surgir barreras sociales o de inadmisibilidad. 
Por ejemplo, una persona que sea alcohólica será muy 
reacia a informar sobre la cantidad de alcohol que consume. 
Otras veces las personas tienden a dar respuestas 
socialmente aceptadas, aunque internamente piensen lo 
contrario. Es posible que contesten en un sentido por 
educación, o para acabar la entrevista o encuesta cuanto 
antes. 



5.7. EL CUESTIONARIO PILOTO 

Una vez que se haya diseñado el cuestionario este debe ser 
sometido a un grupo de personas para efectuar una prueba. 
En una primera confección, es posible que no se acierte con 
aspectos semánticos en las preguntas. Es decir, la redacción 
del cuestionario puede no ser del todo correcta o que no se 
comprenda bien. Es posible, también, que algunas 
preguntas importantes no se hayan incluido, o no estén bien 
matizadas, o que halla un exceso de preguntas y algunas no 
sean significativas. 

Los defectos de contenido y/o forma que pudieran aparecer 
en el cuestionario se detectan mediante pruebas piloto, 
dirigidas a pequeños grupos. Una vez subsanados los 
errores o perfeccionado el cuestionario se podrá dirigir a la 
totalidad de las personas que se considere oportuno que 
deben responderlo. De esta manera se evita tener que 
repetir la investigación por haber difundido un cuestionario 
confuso o erróneo. 

En resumen, la prueba piloto del cuestionario persigue, 

• Eliminar ambigüedades. 

• Eliminar preguntas superfluas. 

• Añadir al cuestionario preguntas relevantes. 

• Simplificar preguntas difíciles. 

• Cambiar el orden de las preguntas para agilizar el flujo 
de respuestas. 

• Corregir la redacción. 

• Eliminar faltas de ortografía. 




• Comprobar que los códigos para grabar los datos más 
adelante sean correctos. 

En la prueba piloto se mide la consistencia interna del 
cuestionario, a través del coeficiente a de Cronbach o el 
coeficiente 6. Se medirá la validez de la escala y si fuera 
necesario de eliminan o añaden ítems o categorías. Las 
pruebas piloto se repiten las veces necesarias hasta 
conseguir la mayor validez del cuestionario. Cuando ésta se 
haya conseguido se reproduce y se distribuye. 

5.8. UN EJEMPLO DE CUESTIONARIO 

El propósito de este cuestionario es la identificación de un 
escenario de percepciones sobre el estado y necesidades de 
las personas mayores para dentro de diez años y de los 
recursos materiales, personales y sociales para afrontarlas 
(Grande y Villanueva, 2002). Los objetivos básicos de 
conocimento de este estudio, en la Comunidad Foral de 
Navarra, respecto a las personas mayores, se pueden 
condensaren los siguientes: 

• Expectativas de salud física y mental. 

• Grado de necesidad percibido, o de dependencia, para 
desarrollar actividades cotidianas. 

• Ayuda esperada de los hijos. 

• Ayuda esperada de amigos o vecinos. 

• Expectativas sobre la situación económica. 

• Recursos económicos para afrontar el futuro. 



• Recursos sociales, personales e institucionales, para 
afrontar el futuro. 

• Expectativas sobre el hogar futuro y su grado de 
atractivo. 

• Valoración de los atributos de las residencias. 

• Fuentes de recursos económicos para hacer frente a una 
situación de cuidados constantes prolongada. 

• Aportación económica para costear la estancia en una 
residencia o la ayuda domiciliaria. 

Antes de elaborar un cuestionario es necesario desarrollar 
estudios de naturaleza cualitativa para identificar aquellos 
ítemes relevantes o contrastar el interés de otros que se 
deseen incluir. De acuerdo con los objetivos de la 
investigación, los ítemes relevantes deben identificarse a 
partir de tres grandes bloques de información que es 
necesario obtener: percepciones personales, necesidadades 
futuras y recursos de diversa naturaleza para afrontarlas. Se 
ha comenzado por identificar las variables relevantes, las 
que darán contenido al cuestionario. Para cumplir este 
objetivo se desarrolló un estudio cualitativo consistente en 
nueve dinámicas de grupo con hombres y mujeres mayores 
en las localidades navarras de Ezcaroz, Sangüesa, Los Arcos, 
Cadreita y Pamplona, a lo largo de febrero de 2000. 

El guión de las dinámicas de grupo fue el siguiente. 

PERCEPCIONES PERSONALES 

Objetivo: recoger información sobre cómo se perciben las 
personas mayores dentro de 10 ó 15 años respecto a. 


Salud 



• Enfermedades somáticas, facultades físicas, limitaciones 
(ver, comprar, hacer la casa, desplazarse, oír, moverse, 
levantarse,...). 

• Estado síquico. 

• Grado de importancia de las enfermedades. 

• Grado de dependencia de otras personas. 

• Grado de validez general, en qué creen que van a 
necesitar ayuda. 

• Qué tareas creen que podrán hacer por sí mismas, en qué 
necesitarán ayuda. 

Economía 

• ¿Seguirán cobrando pensión? 

• ¿Será suficiente la pensión? 

• ¿Tendrá dinero para seguir viviendo con dignidad, como 
hasta ahora? 

• ¿Tendrán ahorros, serán suficientes? 

• ¿Se verán más ricas, más pobres? 

Familia 

• ¿Vivirán en el domicilio, residencia? 

• Con quién vivirán; con hijos, solas, parientes... 

• Grado de atención que proporcionará la familia tanto 
económica como personal. 



• Cuándo y para qué creen que necesitarán ayuda. 

Entorno social 

• Papel que desempeñarán los amigos o los vecinos. 

• Grado de relación con los amigos o con los vecinos. 

• En qué medida los amigos o los vecinos ayudarán, y en 
qué aspectos. 

• Tipo de relación que mantendrán con los amigos o con 
los vecinos. 

NECESIDADES FUTURAS 

Objetivo: identificar en qué aspectos los mayores creen 
que tendrán necesidades. 

• Compañía, transporte, compras, ayuda doméstica, ocio, 
asuntos legales, papeleos y burocracias, asesoramiento 
económico, vistas sanitarias, gestiones en general. 

• Jerarquizar la importancia de las necesidades que 
manifiesten. 

RECURSOS 

Objetivo: identificar con qué recursos de diversa 
naturaleza esperan contar los mayores para afrontar su 
situación. Cuáles son y su grado de importancia. 

• Económicos: pensiones, ahorros, ayudas de los hijos o 
familiares, ayudas económicas de los organismos públicos. 

• Familiares ayudas proporcionadas por la red de 
parentesco. 



• Sociales: Gobierno de Navarra, Ayuntamiento, asistentes 
sociales, ONG's, voluntariado. 

• Sistema de salud público (Osasunbidea). 

• Precios por los servicios. Expectativas sobre la gratuidad 
de los servicios, valorar expectativas de pago, medir 
hipotéticos precios. 

Una vez identificadas las variables relevantes sobre las 
expectativas de las personas mayores respecto de su 
envejecimiento, se diseño el siguiente cuestionario. Nótese 
cómo todas las preguntas van numeradas secuencialmente 
y cómo en ellas figuran los códigos para su posterior 
codificación. Algunas preguntas son nominales (bueno, 
regular, malo). Otras se codifican con variables métricas, 
como edad, renta en pesetas, etc. 

SALUD Y DEPENDENCIA 

1 ¿Cómo cree Ud. que será su estado de salud física? 
{Encuestador, rodea la respuesta) 

1) Bueno 

2) Regular, con algunos problemas por temporadas 

3) Malo. Enfermo crónico 

4) Muy malo. Muy enfermo 

2 ¿Cómo cree Ud. que será su estado de salud 
mental? 

1) Bueno 

2) Regular, con algunos problemas por temporadas 



3) Malo. Enfermo crónico 

4) Muy malo. Muy enfermo 

¿Qué actividades cree Ud. que desarrollará para 
ocupar su tiempo libre y mantener su salud? 
{Encuestador, lee la relación y marca sí o no) 

Elimage 

De las siguientes tareas, indique el grado de ayuda 
que cree va a necesitar para realizarlas. 
{Encuestador, lee la relación, muestra la cartulina y 
anota ¡a puntuación). Mínimo = 0. Máximo = 5. 

Elimage 

19. ¿En qué medida cree Ud. que dependerá, en 
general, de la ayuda de otras personas para resolver 
su vida cotidiana? {Encuestador, mostrar cartulina y 
anotar la respuesta) 

¿Qué tipo de ayuda espera recibir de sus hijos? 
{Encuestador, sólo si tienen hijos, lee la relación y 
anota sí o no) 

Elimage 

¿Qué tipo de ayuda espera recibir de sus amigos o 
vecinos? {Encuestador, lee la relación y anota sí o no) 

Klimage 

38. ¿Con qué frecuencia cree Ud. que necesitará 
ayuda? 


1) De vez en cuando 


2) Con frecuencia 

3) Constantemente 

39. Indique qué sistema resolvería mejor su vida. 
(Encuestador, sólo se admite una respuesta) 

1) Una pensión más alta y haré lo que quiera 

2) Seguir viviendo en mi casa con ayuda domiciliaria 

3) Ir a una residencia 

4) Vivir en viviendas tuteladas (explicar en qué 
consisten) 

5) Acudir a un centro de día y volver a dormir a casa 

6) Ir a vivir con mis hijos permanentemente 

7) Vivir con mis hijos por temporadas 

8) Acoger a alguien en mi casa (como una pensión) a 
cambio de ayuda domiciliaria. 

SITUACIÓN ECONÓMICA 

40. ¿Tendrá dinero para seguir viviendo con 
dignidad, como hasta ahora? 

(1) Sí {pasa a ¡a 41, no preguntes la 47) 

(2) No {pasa a la 47) 

¿POR QUÉ? 

Klimage 


41. ¿Se verá más rica, más pobre? 

(1) Más rica 

(2) Igual que ahora 

(3) Más pobre 

RECURSOS PARA AFRONTAR LA SITUACIÓN PERSONAL 

Para resolver su situación dentro de 10 años Ud. contará con 
algunos recursos, que pueden ser económicos como su 
patrimonio, sociales como la ayuda de sus ami gos, etc. 

Indique el grado de importancia de los diferentes 
recursos económicos que Ud. espera obtener 
{Encuestador mostrar cartulina y anotar ¡a 
puntuación). Mínimo = 0. Máximo = 5. 

Klimage 

Muchas veces, los problemas no se resuelven sólo con 
dinero. Los hijos, los amigos o los vecinos pueden ayudarle 
para cubrir algunas necesidades, como desplazarse, 
ayudarle a ir de compras o hacerle compañía. Indique 
cuánta ayuda espera recibir de su entorno social 
para resolver su situación personal dentro de 10 
años por parte de ... {Encuestador, mostrar la 
cartulina y anotar la puntuación). Mínimo = 0. 
Máximo = 5. 

Elimage 

68. ¿En qué medida cree Ud. que hacen falta 
residencias en la zona donde vive? {Encuestador, 
mostrar la cartulina y anotar la puntuación). De 0 a 
5. 


69. Indique cuál de las siguientes alternativas 
resolvería el problema de la atención de las 
personas mayores donde Ud. reside. {Encuestador, 
sólo se admite una respuesta) 

(1) Ayuda domiciliaria 

(2) Residencias 

(3) Viviendas tuteladas 

70. En caso de tener que abandonar su vivienda, 
¿dónde cree que irá a vivir? {Encuestador, sólo se 
admite una respuesta) 

(1) A una residencia 

(2) A una vivienda tutelada 

(3) Con mis hijos o familiares 

(4) Con otros parientes 

Indique el grado de importancia de las siguientes 
características que podría tener una residencia 
{Encuestador, mostrar la cartulina y anotar la 
puntuación). (Entre cero y cinco). 

Elimage 

Imagínese que dentro de unos años necesita muchos 
cuidados y atención constante y eso supone elevados 
gastos. Indique qué haría. {Encuestador, lee la 
relación y anota sí o no) 

Elimage 


87. Suponga que tiene que ingresar en una residencia y que 
esa residencia cuesta 1.000 euros al mes ¿Cuánto dinero 
podría pagar Ud. al mes de esa cantidad? 

_euros 

88. Suponga que Ud. necesita cuidados permanentes en su 
domicilio, que suponen 500 euros al mes. ¿Qué cantidad 
podría pagar de esos 500 euros al mes? 

_euros 

89. Nombre de la localidad 


90. Código postal. 

91. Tamaño.habitantes 

92. Distancia a Pamplona_Km 

93. ¿A qué distancia viven sus hijos o familiares más 

cercanos?_Km. 

94. La casa donde vive es 

Propia 1 

Alquilada 2 

De las personas con las que ^ 
vivo 

Cedida temporalmente 4 

95. Tipo de vivienda 


Casa 1 
Piso 2 






96. Altura (si es piso) .... 

97. Superficie. 

98. Año de construcción 


piso 


m 


2 


99. Número de cuartos de baño 
Elimage 

112. Género 

Hombre 1 
Mujer 2 

113. Estudios 

Sin estudios 1 
Elementales 2 
Medios 3 
Superiores 4 

114. Edad.años 

115. Estado civil 

Soltero 1 
Casado 2 
Viudo 3 
Separado 4 

116. Número de hijos (hombres) 

117. Número de hijas (mujeres) 

118. Ud. vive, 









Solo 1 

Con su cónyuge 2 
Con hijos en mi casa 3 
Con hermanos 4 
En casa de mis hijos 5 
Con otros parientes 6 

119. ¿Cuántas personas dependen económicamente de Ud.? 


120. ¿Percibe una pensión por 

Régimen agrario 1 
Régimen autónomo 2 
Régimen de minería 3 
Empleadas de hogar4 


Régimen general 5 

Viudedad 6 

Orfandad 7 

Asistencial 8 

No contributiva 9 

Otra 10 


121. ¿A cuánto ascienden sus ingresos mensuales por todos 
los conceptos? (en euros) 

300-400 1 

401-500 2 

601-700 4 

701-800 5 

801-900 6 

901-1.000 7 





1.001-1.1008 
1.101-1.2009 
1.201-1.300 10 
1.301-1.400 10 
1.401 y más 11 

122. Estado de salud actual 

Bueno 1 

Regular, con algunos problemas por temporadas 2 
Malo. Enfermo crónico 3 

Muy malo. Muy enfermo 4 

123. En general, su calidad de vida es 

Muy mala 1 
Mala 2 

Regular 3 
Buena 4 

Muy buena 5 
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Medición y escalas 
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MEDICIÓN Y ESCALAS 

6.1. OBJETIVOS DEL CAPÍTULO 

En este capítulo se proporciona un conjunto de conocimientos 
fundamentales sobre medición y construcción de escalas. Tras 
su lectura sabrá: 

• Qué es una escala de medición. 

• Qué son escalas primarias: nominales, ordinales, de 
intervalo y métricas. 

• Qué son escalas comparativas y sus clases: suma 
constante, jerarquizadas, de comparación por pares y de 
asociación. 

• Qué son escalas no comparativas, continuas e itemizadas; 
de Likert y diferenciales semánticos. 

• Qué son escalas multiítem y por qué se elaboran. 

• Qué es un concepto, qué son categorías y qué criterios se 
emplean para diseñarlas. 

• Cómo se valoran las escalas: qué es fiabilidad y cómo se 
mide. Qué son la validez y generabilidad de las escalas. 

• Qué criterios se pueden emplear para valorar escalas ya 
construidas. 


6.2. MEDICION. ESCALAS Y SUS 
PROPIEDADES 







El concepto de medición puede entenderse como «la forma de 
obtener símbolos para representar propiedades de las personas, 
cosas, sucesos o ideas, según la cual esos símbolos guardan una 
relación entre ellos de la misma forma que los entes que 
representan» (Creen et al. 1988; 242). La medición también 
puede entenderse como la asignación de números a objetos para 
representar sus propiedades o las relaciones entre ellos. Para 
comprender bien las escalas de medición debe prestarse 
atención a las siguientes propiedades que pueden tener los 
números: 

• Orden o secuencia numérica ordenada. Por ejemplo, un kg, 
dos kg, tres kg, etc. 

• Distancia o diferencias entre números, sin que se preste 
atención al origen. Por ejemplo, entre 15 y 20 existen 
5 ^C; entre ganar 1.000 euros o 1.570 euros existe una 
diferencia de 570 euros. 

• Origen. Las series pueden tener un único origen 
determinado por el cero. Por ejemplo, la edad, la renta o el 
pesoson magnitudes cuyo origen es el cero. 


6.3. CLASES DE ESCALAS 

El esquema siguiente resume los diferentes tipos de escalas 
que serán expuestas en este capítulo. 

Gráfico 6.1. Clases de escalas 
t^image 


6.3.1. Escalas primarias 

La clasificación más elemental de escalas es la que diferencia 
entre nominales, ordinales, métricas de intervalo y métricas 


continuas. 


* Escalas nominales 

Son las escalas más restrictivas de todas. No poseen ni orden, 
ni distancia, ni origen. Se emplean para medir aspectos 
cualitativos. Los números identifican y clasifican objetos 
mutuamente excluyentes. Ejemplos muy ilustrativos de escalas 
nominales son nuestro DNI, cuyo número sólo sirve para 
identificarnos, las referencias de los productos en las etiquetas, 
las tallas de los zapatos, los números de las camisetas de los 
futbolistas o los dorsales de los ciclistas. Esos identificadores se 
pueden proporcionar de forma arbitraria: pueden ser números, 
letras o códigos alfanuméricos. 

Se emplean generalmente para identificar a los individuos - 
personas, empresas, organismos, establecimientos comerciales, 
etc.- en los cuestionarios. Los individuos de una misma clase 
tienen el mismo número. En un cuestionario se podría llamar 1 a 
los hombres, 2 a las mujeres. Si se prestara atención a la 
situación laboral de las personas, 1 podría indicar cuadro 
superior; 2 indicaría cuadro intermedio; 3, funcionario; 4, 
pensionista; 5, parado, etc. Esta escala no es proporcional. 2 no 
es el doble de uno, ni 10 es dos por cinco. Los números sólo son 
códigos de identificación. 

* Escalas ordinales 

Las escalas ordinales sólo indican posiciones relativas. Sólo 
poseen la propiedad de orden, pero no las de distancia ni 
origen. Entre los números no existe ninguna relación de 
proporcionalidad. La diferencia entre ellos no mide ninguna 
magnitud que tenga sentido. Esta escala se utiliza en marketing 
especialmente para medir preferencias, posiciones en el 
mercado o calidad. Consisten, generalmente, en una ordenación 
de las preferencias de los consumidores. Así, por ejemplo, un 
fumador podría asignar 1 a Winston, 2 a Mariboro y 3 a Fortuna; 
1, 2 y 3 indican el orden de preferencia de las tres marcas 
reseñadas. 



* Escalas métricas de intervalo 

En ellas los números sirven para medir las diferencias entre los 
objetos de forma que las distancias en la escala representan las 
mismas distancias en la valoración de esos objetos, como sucede 
con las temperaturas. Las escalas métricas de intervalo 
cuantifican la distancia entre dos números. Estas escalas poseen 
las propiedades de orden y distancia, pero el cero es arbitrario. 
La escala métrica de intervalo mantiene un orden y las 
diferencias de valores tienen sentido, cosa que no sucede con las 
escalas de orden. No poseen la propiedad de origen, porque el 
cero es arbitrario. 

La diferencia entre 1 y 3 es la misma que entre 3 y 5, pero 3 no 
es el triple que 1. La diferencia entre 5, 10, 15, 20 y 25 es de 
cinco grados entre cada valor consecutivo. Llamamos 0 a la 
temperatura de congelación del agua, y 100 a la de 
ebullición, eso en la escala centígrada. En la escala Reamur el 
agua se congela a 0 ^C, pero hierve a 80 ^C. En la Fahrenheit la 
temperatura de congelación es de 32 y la de ebullición 212 
^C. 

No tiene sentido calcular relaciones. 20 no significa que se 
esté 20 veces mejor que a 1 ^C. Las operaciones que se pueden 
realizar son, además de las ya citadas en las escalas reseñadas, 
medias aritméticas, desviaciones, correlaciones, etc. 

* Escalas métricas continuas 

Tienen las propiedades de orden, distancia y origen. Se 
asignan valoraciones a algún objeto de forma que esa valoración 
tenga las propiedades de origen, distancia y orden. Por ejemplo, 
se podría pedir que se valorara de 0 a 5 la calidad de un 
producto, entendiendo que 0 es la peor calidad y 5 la mejor. Se 
pueden valorar estímulos, objetos o atributos concretos. Se 
pueden valorar atributos de una marca de ropa como calidad, 
diseño, precio y elegancia, o la calidad de servicio en un hotel, 
restaurante, etc. Estas escalas poseen todas las propiedades de 



las escalas nominales, ordinales y de intervalo. El cuadro 6.1 
compara las escalas expuestas. 

6.3.2. Escalas comparativas 

En el apartado anterior se han expuesto escalas por las 
propiedades de los números empleados: orden, distancia y 
origen. Sin embargo, debe profundizarse más. Las escalas en 
marketing se pueden clasificar en comparativas y en no 
comparativas. Como puede deducirse, las primeras permiten 
hacer comparaciones entre los objetos (marcas, modelos, 
productos, entidades, etc.) que se estudian. Las más frecuentes 
son las siguientes: 

• Escala de suma constante. Consiste en repartir una 
puntuación entre unos determinados atributos. Por ejemplo, 
se podrían repartir 100 puntos entre tres atributos de 
televisores como muestra el cuadro siguiente: 

t^image 

• Escalas jerarquizadas. El respondiente establece un 
orden de preferencias. Por ejemplo, «las marcas de aparatos 
de sonido que más me gustan son, en este orden. Denon, 
Luxman, JVC y Sony». 


t^image 

• Escalas de comparación por pares. Las personas que 
responden tienen que elegir uno de los dos objetos que 
secuencialmente se les presentan. Por ejemplo, se le 
pueden presentar dos marcas de pasta dental: Colgate y 
Binaca; otro par puede ser Binaca y Profiden. Si prefiere 
Colgate a Binaca y Binaca a Profiden se concluye que su 
orden de preferencias es Colgate, Binaca y Profiden. 
Aplicando la propiedad transitiva se llega a formular un 
orden. 


Escalas de asociación. A través de ellas se trata de 
relacionar atributos de diversos conjuntos. Una escala de 
asociación es la siguiente: 

t^image 


Cuando se está de acuerdo con la asociación se «marca» la 
casilla correspondiente. Las escalas de asociación proporcionan, 
cuando se tabulan, tablas de frecuencias de asociación entre los 
atributos y los objetos -en este caso marcas de motos- como, por 
ejemplo: 


t^image 


6.3.3. Escalas no comparativas 

Las escalas no comparativas más conocidas son las de Likert y 
los diferenciales semánticos. 

• Escala de Likert. Consiste en formular proposiciones 
relativas a una serie de atributos de un objeto y que el 
entrevistado exprese su grado de acuerdo o desacuerdo en 
una escala de varias categorías que pueden ser 3, 5, 7, 9 u 
11. Cada categoría se puntúa con un número que se le 
asigna. Un ejemplo de escala de Likert de cinco categorías 
es la siguiente: 


i^^image 

Una escala de Likert de 3 categorías es la siguiente: 

t^image 


• Diferenciaies semánticos. El criterio no viene definido 
por una proposición, para la que se indican los grados de 
acuerdo o desacuerdo, sino por categorías opuestas de una 
dimensión. En el ejemplo que figura a continuación se 
consideran algunas dimensiones de unos motores, como el 


diseño, el consumo, la fiabilidad, el ruido, etc. Quien 
responda a la escala debe manifestar una tendencia hacia 
las categorías opuestas de la dimensión considerada. 


Los motores Indarra: 






Tienen un diseño 

[] 

[] 

[] 

[] 

[] 

avanzado 

[] 

[] 




Consumen mucha 

[] 

[] 

[] 

[] 

[] 

gasolina 

[] 

[] 




Se averian poco 

[] 

[] 

[] 

[] 

[] 


[] 

[] 




Son ruidosos 

[] 

[] 

[] 

[] 

[] 


[] 

[] 




Su mecánica es 

[] 

[] 

[] 

[] 

[] 

simple 

[] 

[] 




Contaminan poco 

[] 

[] 

[] 

[] 

[] 


[] 

[] 





Su diseño es anticuado 
Consumen poca gasolina 
Se averian con frecuencia 
No son ruidosos 
Su mecánica es complicar 
Contaminan mucho 


El encuestado se acerca hacia la «zona» con la que esté más 
de acuerdo. Habitualmente, los atributos desfavorables se sitúan 
unas veces a la izquierda y otras veces a la derecha. Se hace así 
para evitar que algunas personas respondan siempre a la 
izquierda o a la derecha sin leer las afirmaciones. A veces es 
difícil encontrar la definición de los extremos. 

Algunos de los extremos de la escala son muy sencillos, 
porque existen antónimos, por ejemplo bueno-malo, claro- 
oscuro. Otras veces es más difícil precisar; por ejemplo, los 
antónimos de potente, ergonómico, aerodinámico hay que 
definirlos mediante redacciones ex profeso. 

Cada casilla es codificada con un número, que oscila entre el 
máximo (siete en este caso, aunque nueve y once también son 
frecuentes) para la proposición más favorable y uno para la 
menos favorable. 



6.3.4. Escalas itemizadas. Concepto y 
construcción 

Este tipo de escala no comparativa se caracteriza porque 
contiene varias afirmaciones o proposiciones, relativas a un 
objeto, que guardan relación entre sí, y que deben ser asociadas 
a categorías. Tienen varios ítems porque miden conceptos 
complejos. Una escala mide un concepto; por ejemplo, la 
calidad. Pero los conceptos pueden tener varias dimensiones. La 
calidad se mide a través de elementos tangibles, como el 
aspecto de las personas, de las instalaciones o de los materiales 
que se emplean. Otras dimensiones de la calidad son la 
capacidad de respuesta, la empatia, la seguridad, la fiabilidad, o 
la cortesía. Una escala multiítem recoge las distintas 
dimensiones del concepto que se pretende medir con la escala. 
Las razones que aconsejan emplear escalas itemizadas son la 
fiabilidad de las mediciones y la precisión o abundancia de 
matices cuando los conceptos son complejos. A continuación se 
expone la metodología para construir escalas multiítem. Ver 
gráfico 6.2. 

Gráfico 6.2. Metodología para construir escalas 

l-'^image 


* El concepto 

• En primer lugar, deben definirse una serie de 
características u objetos a medir, que en nuestro 
idioma denominamos concepto, que se basan en alguna 
teoría o hipótesis. El fundamento de este concepto se basa 
en una extensa investigación cualitativa, una revisión 
bibliográfica, o en estudios empíricos. Por ejemplo, calidad 
de servicio, fidelidad o etnocentrismo, son conceptos. 

• En segundo lugar, deben definirse las dimensiones del 
concepto. Tratándose de la calidad, algunas de sus 
dimensiones son la tangibilidad, la seguridad, fiabilidad. 


comunicación, empatia y la cortesía. Es posible que el 
número de dimensiones sea excesivo. Un juicio de expertos 
permitirá cribar las dimensiones propuestas. Una vez que se 
definen las dimensiones del concepto se redactan los ítems, 
es decir, las preguntas. Por ejemplo, para medir la tendencia 
a la fidelidad de los consumidores se pueden utilizar los 
siguientes ítems ante los cuales se pide al encuestado que 
indique su grado de acuerdo o de desacuerdo con las 
siguientes afirmaciones: 

1. Generalmente compro la misma marca siempre. 

2. Una vez que elijo un marca, tiendo a seguir con ella y 
me olvido de las demás. 

3. Una vez que elijo una marca, detesto los cambios. 

4. SI me gusta una marca, raramente cambio por probar 
algo distinto. 

5. Aun cuando un mismo producto esté disponible en 
varias marcas, tiendo a comprar la misma. 

En tercer lugar, las preguntas se someten a un 
proceso de criba, en el que un grupo de personas opinará 
sobre su conveniencia o adecuación. Puede que existan 
ítems que no tenga mucho sentido incluirlos, que sean 
irrelevantes, o que no se entiendan. Un juicio de expertos 
clasifica los ítems por su afinidad. El grupo lo forman 
personas con conocimientos y criterios sobre la materia que 
se va a estudiar para poder clasificar los ítems en grupos 
homogéneos. En la propuesta de escala anterior el grupo de 
expertos ha decidido eliminar el primer ítem por 
considerarlo redundante y es a su juicio igual que el 
segundo, con lo cual la escala queda así: 

1. Una vez que elijo un marca, tiendo a seguir con ella y 
me olvido de las demás. 

2. Una vez que elijo una marca, detesto los cambios. 



3. Si me gusta una marca, raramente cambio por probar 
aigo distinto. 

4. Aun cuando un mismo producto esté dispon ibie en 
varias marcas, tiendo a comprar ia misma. 

• Posteriormente se redacta definitivamente la escala, 

se aplica y se miden la fiabilidad y su validez, es decir, su 
capacidad de medición del concepto en toda circunstancia. 
En caso afirmativo la escala se acepta y en caso contrario se 
vuelve a fases previas. 

Escala de medición de la calidad de servicio. Escala 

Servqual 

Piense en ... (hotel, banco, línea aérea...). A continuación se le 
van a formular una serie de preguntas sobre esta entidad. 
Conteste, por favor, a las siguientes afirmaciones con un 
número entre 0 y 10, teniendo en cuenta que 0 = total 
desacuerdo con la afirmación y 10 indica el máximo acuerdo. 


1. Los equipos que emplea la entidad tienen 
apariencia moderna 


2. Las instalaciones físicas de la entidad tienen 
apariencia moderna 


3. Los empleados de la entidad tienen apariencia 
pulcra 


4. Los materiales relacionados con el servicio (folletos, 
impresos...) son visualmente atractivos 


5. Cuando la entidad promete hacer algo en cierto 
tiempo realmente lo hace 


6. Cuando tengo algún problema la entidad muestra 
interésen resolverlo 










7. La entidad ha realizado bien sus servicios desde la 
primera vez 

8. No comete errores con los registros, extractos y 
anotaciones, etc. 

9. La entidad concluye el servicio en el tiempo 
prometido 

10. Los empleados comunican cuándo concluirá el 
servicio 

11. Los empleados ofrecen un servicio rápido 

12. Los empleados están dispuestos a ayudar 

13. Los empleados responden correctamente a las 
preguntas que se les hacen 

14. El comportamiento de los empleados transmite 
confianza 

15. Me siento seguro con la entidad 

16. Los empleados son amables 

17. Los empleados tienen conocimientos para 
responder a mis preguntas 

18. Recibo atención individualizada 

19. El horario de la entidad me resulta cómodo 

20. La entidad se preocupa por mis intereses, por 
aquello que me beneficia 















21. Los empleados comprenden mis necesidades 


* Las categorías 

Para diseñar las escalas deben tenerse en cuenta los 
siguientes aspectos relativos a las categorías: 

• Número de categorías de la escala. Si es métrica 
continua tienen uno, el valor que asigna el encuestado. 
Generalmente las escalas de Likert consideran cinco 
categorías, aunque es frecuente encontrar estudios con 
siete, nueve e incluso con trece. Los diferenciales 
semánticos suelen tener entre 7 y 9 categorías. Cuanto 
mayor sea el número de categorías más precisa será la 
escala, en principio. Cuando el número de categorías es 
amplio, cosa que sucede cuando se dispone de cinco o más, 
los códigos asignados a las categorías tienen las 
propiedades de los números, es decir, la escala se convierte 
en métrica. Sucede, sin embargo, que algunos grupos de 
población no son capaces de desenvolverse con demasiadas 
categorías. Dificultades de percepción derivadas de la 
edad reducida o elevada, cultura o nivel de inteligencia, 
pueden aconsejar reducir el número de categorías a tres o 
cinco como máximo. La práctica aconseja que sean siete 
más menos dos, es decir, 5, 7 ó 9. El número de categorías 
también depende de la forma de recoger la información. Si 
hay tiempo y caima, por ejemplo en encuestas a 
domicilio, se pueden emplear más categorías que si la 
información se recoge con más prisa, como sucede con las 
encuestas en establecimientos o por teléfono. También 
influye el grado de conocimiento que se tenga sobre los 
ítems que se preguntan. A mayor conocimiento o interés 
por responder, mayor es el número de categorías posible. 

• Categorías equiiibradas o no. Una escala se encuentra 
equilibrada cuando el número de categorías favorables y 
desfavorables coinciden, como en la siguiente: 




t^image 


Existen dos desacuerdos y dos acuerdos. En general es mejor 
utilizar escalas equilibradas. Sin embargo, si tras una primera 
prueba se observara que existen muchas más respuestas 
favorables (o desfavorables), podrían añadirse más categorías en 
el sentido observado y reducirlas en el que menosrespuestas se 
hayan encontrado. 

La escala que aparece a continuación está desequilibrada: 

t^image 

• Número de categorías pares o impares. 

En esta escala de Likert el número de categorías es impar: 

i^^image 

Pero esta es par, pues ha desaparecido la categoría 
indiferente: 


t^image 

La decisión de un número de categorías par o impar debe 
tomarse después de haber hecho alguna prueba con el 
cuestionario. Si algunas personas manifiestan la conveniencia de 
incluir la categoría indiferente, así se hará. 

• Respuestas forzadas. En una escala las respuestas se 
fuerzan cuando no se proporcionan opciones intermedias, 
porque se elimina la opción indiferente, o no se contempla 
el no sabe-no contesta. Cuando no saben contestar tienden 
a responder «indiferente». En estos casos las personas 
tienden a proporcionar una valoración media que no es real, 
y que puede distorsionar los resultados. No sabe-no contesta 
tiene que ser una opción más de respuesta, que puede 
materializarse en una categoría adicional o, sencillamente, 
en dejar en blanco la respuesta por parte de la persona que 


responde o recoge la información. Esta escala, además de 
ser par, está forzada. 


t^image 

• Grado de descripción verbai de ias categorías. Debe 
prestarse mucha atención a los adjetivos que se empleen. 
Por ejemplo, cabe esperar respuestas distintas ante estas 
afirmaciones en una escala de diferencial semántico. Por 
ejemplo: 

Talleres Gómez, 

Proporciona un servicio pésimo [] [] [] [] [] [] [] 
Proporciona un servicio óptimo 

Talleres Gómez, 

Proporciona un servicio malo [] [] [] [] [] [] [] Proporciona 
un servicio bueno 


Cuando se hacen afirmaciones rotundas (servicio pésimo, 
servicio óptimo) las personas tienden a responder alrededor de 
la media. Cuando se es menos contundente (servicio malo, 
servicio bueno) las respuestas se pueden aproximar a los 
extremos. 

Las recomendaciones para redactar las proposiciones de 
cada ítem son: 

• El ítem debe expresar sólo una idea o concepto. 

• Deben emplearse y alternarse proposiciones positivas y 
negativas para evitar respuestas de carrerilla. 

• Deben evitarse expresiones vulgares, jerga o argot. 

• La redacción debe adaptarse al nivel cultural o intelectual 
de las personas que responderán. 

Cuadro 6.2. Valoración de escalas 


Tipo de escala 

Ventajas 

Inconvenientes 

Nominal 

• Muy fácil de diseñar 

• Muy fácil de 
comprender 

• Ausencia de sesgos 
en su redacción 

• No requiere 
conocimientos 
especiales del 
encuestado 

• Muy útil en estudios 
con variables 
cualitativas 

• No fatiga 

• Pocas 
posibilidades 
de tratamiento 
cuantitativo 

• Análisis 
estadísticos 
muy limitados 

Ordinal 

• Muy fácil de diseñar 

• Muy fácil de 
comprender 

• Ausencia de sesgos 
en su redacción 

• No fatiga 

• Pocas 
posibilidades 
de tratamiento 
estadístico 

• Puede cansar 

en 

cuestionarios 

largos 

• Requiere 
experiencia o 
conocimientos 
para poder 
jerarquizar 

• Puede ser 
difícil de aplicar 
cuando la lista 

a ordenar es 
amplia 


Intervalo • Fácil de redactar • Reservada a 
• Riesgo bajo de personas con 

introducir sesgos en conocimientos 

elevados de la 










Métrica continua 


Suma constante 


su redacción materia que se 

• Muchas posibilidades investiga 

de tratamiento • Requiere un 

cuantitativo nivel cultural 

medio o alto 

• Obliga a 
reflexionar 
mucho 

• Fatiga 

• Reservada a 
personas con 
conocimientos 
elevados de la 
materia que se 
investiga 

• Requiere un 
nivel cultural 
medio o alto 

• Obliga a 
reflexionar 
mucho 

• Requiere una 
redacción muy 
precisa 

• Puede haber 
dificultades de 
comprensión 

• Fatiga 

• Muy fácil de redactar • Fatiga 

• Su 

comprensión 
puede ser difícil 

• Queda 
reservada a 
cuestionarios 
cortos 


• Fácil de redactar 

• Máximas 
posibilidades de 
tratamiento 
cuantitativo 






• Sólo responden 
bien las 
personas 
capaces de 
calcular 
ágilmente 

• Reservada a 
expertos en la 
temática que se 
investiga 

• Puede resultar 
ser muy 
aburrida y 
cansada 

• La tabulación y 
el análisis de 
datos pueden 
ser complejos 

• Muy fácil de redactar 

• Muy fácil de 
comprender 

• No cansa 

• Las respuestas son • Tratamiento 

muy fiables cuantitativo 

Asociación • No requiere limitado, 

conocimientos contrastes chi- 

especiales de los cuadrado, AFC 

encuestados 

• Se analiza con 
análisis factorial de 
correspondencias 

Likert • Muy fácil de diseñar • Peligro de 

• Muy fácil de desequilibrarla 

comprender escala 

• Riesgo bajo de sesgos • Peligro de 

en su redacción forzar la escala 







• No requiere • Peligro de 

conocimientos decantación 

especiales de los hacia 

encuestados posiciones 

• No fatiga intermedias por 

• Muchas posibilidades parte de los 

de tratamiento encuestados 

cuantitativo • Tratamiento 

cuantitativo 

limitado 

• Peligro de 
incluir pocas 
categorías o 
demasiadas 

• Puede haber 
dificultades 
para depurar la 
escala 



• Muchas posibilidades 

• Pocas pistas 
verbales 

• Redacción muy 
escueta 

• Alguno de los 

Diferencial 

de tratamiento 

extremos puede 

semántico 

cuantitativo 

ser ambiguo o 


• Fácil de comprender 

discutible 



• Es difícil de 
redactar sin 
introducir 
sesgos 


Fuente: Elaboración propia. 


6.4. FIABILIDAD DE ESCALAS 






Una escala es un instrumento de medida, como lo es un 
barómetro o una cinta métrica. Los instrumentos de medida 
tienen que cumplir dos requisitos: ser fiables y válidos. Son 
fiables cuando siempre miden lo mismo. Son válidos cuando 
además miden lo que tienen que medir. Todos los instrumentos 
de medida cometen errores, que pueden ser de dos clases: 
aleatorios y sistemáticos. 


6.4.1. Clases de error y sus fuentes 

• Error aleatorio. Lo constituyen todos aquellos factores 
que no se pueden controlar y confunden la medición de 
un fenómeno. Por ejemplo, el velocímetro de un coche 
puede tener un error variable e impredecible de hasta un ± 
30%. Esto significa que la velocidad real del coche cuando 
circule a 100 km./h de aguja podrá tomar cualquier valor 
comprendido entre 70 y 130 km./h. El error es variable en 
cantidad y en sentido. Hace que no sea posible saber a qué 
velocidad real se circula, con el consiguiente peligro de ser 
denunciado por los radares que controlan la velocidad. En 
las investigaciones comerciales los errores aleatorios 
proceden de las personas que responden o preguntan, o de 
las situaciones que rodean la recogida de información. Este 
error no es constante. Afecta a las mediciones de forma 
variable cada vez que se hacen. Todos los instrumentos de 
medición, tanto físicos como las escalas, generan errores 
aleatorios en mayor o menor grado. Cuanto mayor sea el 
error aleatorio, menor será la fiabilidad de un instrumento. 
Lo deseable es diseñar instrumentos de medición, escalas 
en nuestro caso, que lo minimicen. Cuando el error aleatorio 
es pequeño, por ejemplo, el velocímetro lo tiene entre ± 1%, 
la estimación de la medición se puede considerar precisa. 

• El error sistemático lo constituyen aquellas fuentes que 
afectan a las mediciones de forma constante y suponen 

factores estables que afectan de la misma forma e 
intensidad cada vez que se hacen las mediciones. Por 



ejemplo, un velocímetro podría tener torcida la aguja y 
marcar siempre diez km. por hora en exceso. Entonces, a 
cualquier velocidad se sabe que la real será de 10 km. por 
hora menos de los marcados. En tales circunstancias un 
conductor sabría exactamente a qué velocidad circula en 
todo momento. La bastaría con restar 10 km./h a lo que 
marca el velocímetro. 

Tratándose de investigaciones comerciales, algunas de las 
fuentes de error aleatorio y sistemático son las que aparecen el 
cuadro 6.3. 


Cuadro 6.3. Fuentes de error en las investigaciones 


Fuentes de error aleatorio 

Fuentes de error 
sistemático 

• Errores de codificación 


• Errores de tabulación 

• Items incluidos en la escala 
mal 

• Características de las 
personas que seleccionados 
responden, como 
inteligencia o cultura, salud 

0 estado emocional 

• Ausencia de claridad de la 
escala, incluso de 
instrucciones para 
cumplimentarla 

• Factores coyunturales como 
ruido, distracción, presencia 
de otras personas, cansancio 

• Errores físicos en la escala, 
como mala calidad de 
impresión de la escala, 
exceso de ítems, diseño poco 
claro, etc. 

• Características de los 
encuestadores o 
entrevistadores muy 
dispares como simpatía, 
empatia o don de gentes 

• Errores de redacción de los 
ítems de la escala 

• Énfasis de las palabras de los 
encuestadores o 








entrevistadores 

Adaptado de Malhotra, 1993: 307, y Carmines y Zeller, 1979: 14. 


6.4.2. Medición de la fiabilidad de las 
escalas 

Se dice que una escala es fiable cuando proporciona 
resultados consistentes cada vez que se realizan mediciones 
con ella, cuando siempre mide lo mismo. Como las fuentes de 
error sistemático afectan siempre de la misma forma y con la 
misma intensidad a las mediciones, la fiabilidad de una 
escala está condicionada por el error aleatorio. 

Si una escala se viera libre de error aleatorio, su fiabilidad 
sería perfecta. Una escala fiable no significa que sea válida. Si a 
una regla indilatable de 23 cm la llamamos metro, nos 
proporciona mediciones fiables. Siempre que la utilizáramos 
mediría «metros de 23 cm». Siempre mediría lo mismo, pero no 
sería válida, porque un metro mide 100 cm. Si ese metro de 23 
cm fuera de goma elástica, nuestras mediciones no serían ni 
fiables ni válidas. La longitud de la regla dependería de la 
tensión que se aplicara a los extremos, que podría tener la 
consideración de aleatoria en función de la persona que la 
utilizara, su fuerza o envergadura. Podríamos medir metros de 
34 cm, de 40 cm o de 28, según la fuerza que se aplicara. Esta 
regla no sería ni fiable ni válida. Cada medición sería distinta y 
ninguna de un metro de longitud. Para medir la fiabilidad de una 
escala se pueden emplear varias técnicas: 

1. Test-retest 

2. Las formas alternativas 

3. El método de las mitades 

4. La consistencia interna o coeficiente a 

5. El coeficiente 6 




1. El test-retest consiste en suministrar la misma escala a 
la misma muestra en unas condiciones similares, para que 
responda. Para medir la fiabilidad se calcula el coeficiente 
de correlación de Pearson entre las respuestas dadas por la 
misma muestra de personas a una misma escala en dos 
momentos separados en el tiempo. El test-retest no es una 
prueba buena para medir la fiabilidad. Algunas razones 
son las siguientes: 

a. En primer lugar, las pruebas se repiten pasado 
un tiempo; se produce una maduración, y 
también puede haber efectos principales e 
interactivos como sucede con los 
experimentos. Puede que las personas tengan 
mayores conocimientos, experiencia, interés o 
preocupación por el hecho que se investiga. 

b. En segundo lugar, las condiciones del medio 
pueden cambiar mucho y las condiciones de la 
obtención de información en distintos 
momentos puede que no sean comparables. 

c. Es posible que no pueda repetirse el test. 

Sería el caso de medición de actitudes ante un 
producto nuevo una vez comercializado. 

f En realidad, el test-retest mide más la 
estabilidad que la fiabilidad. 

2. Para medir la fiabilidad mediante formas alternativas 
se procede a diseñar dos escalas equivalentes que se 
proporcionan para ser respondidas en dos momentos 
diferentes del tiempo. Además de las limitaciones del test- 
retest puede resultar complicado preparar dos escalas a la 
vez. De hecho ya es bastante complicado diseñar la 
primera. 

3. El método de las mitades es otra forma de medir la 
fiabilidad de una escala. Consiste en calcular la correlación 



entre dos mitades un conjunto de ítems. Por ejemplo, se 
distribuye una escala, y se calcula la correlación entre los 
ítems pares y los impares, o entre la mitad de la muestra y 
la otra mitad. El coeficiente de Spearman-Brown permite 
calcular la fiabilidad de la escala. Toma valores 
comprendidos entre cero y uno. Su expresión más simple 
es: 


p sp = 2 p / ( 1 + p) 

donde p es el coeficiente de correlación de Pearson entre 
las dos mitades consideradas. Se observa que si p = 0, el 
coeficiente de fiabilidad de Spearman-Brown valdrá cero. 
Cuando la correlación sea perfecta, p = 1, el coeficiente de 
fiabilidad p gp será máxima y valdrá uno. Este método tiene 
la ventaja de estimar la fiabilidad en un momento del 
tiempo. No necesita de dos o más muestras a lo largo del 
tiempo, como con los métodos antes expuestos. Por 
ejemplo, una prueba con 100 preguntas proporciona una 
correlación de 0,84 entre las preguntas pares e impares. El 
coeficiente de fiabilidad del test es: 


Psp = 2 ■ 0,84/( 1 0,84) = 0,91 


La fórmula de Spearman-Brown se llama profética, 
porque sirve para predecir coeficientes de fiabilidad según 
su expresión general, que es: 


Psp = Kp/[1 (K-1) p] 

donde K es el número de veces que la longitud del test es 
mayor o menor que el test original. Si una escala tiene 180 
preguntas y un coeficiente de fiabilidad de 0,92, si se 
reduce a 90 la fiabilidad de la escala será (K = 90 /180 = 
0,5) 


Psp = Kp/[1 -K (K-1) p] = 0,50 ■ ( 

0,92 / [1 -K (0,5 -1) ■ 0,92] = 

0,852 








Si una escala tiene 15 preguntas y su fiabilidad es de 0,65, 
si tuviera 75 su fiabilidad sería: 


(K= 75/15 = 5) 


p sp = K p / [1 + (K-1) p] = 5-0,65 / [1 + (5 - 1) ■ 0,65] = 0,902 

4. La cuarta forma de medir la fiabilidad de una escala es 
estimar su consistencia interna. Para ello existe un 
instrumento que se denomina coeficiente a de Cronbach. 
Si se parte de la matriz de correlaciones entre ítems, el 
coeficiente a de Cronbach se estima a partir de la 
correlación media entre los ítems 


g = N p/ [1 + p (N -1)] 

En la cual p es coeficiente de correlación media entre ítems 
y N es número de ítems. El coeficiente a de Cronbach es 
una prueba muy utilizada para pronunciarse sobre la 
fiabilidad de una escala. Mide en un momento del tiempo, y 
sin necesidad de hacer repeticiones, la correlación 
esperada entre la escala actual y otra forma alternativa. Sin 
embargo conviene hacer algunas matizaciones. 

1. En primer lugar, el coeficiente se eleva a 
medida que aumenta el número de 
ítems. Esto significa que, en principio, 
cuantos más ítems se incluyan, mayor será la 
consistencia interna y la fiabilidad de la escala. 

Pero todo tiene un límite. 

2. La fiabilidad no crece 
proporcionalmente con el número de 
ítems. Además, cuantos más ítems se tengan 
en cuenta más cuesta construir la escala, 
recoger la información, tratarla, analizarla, etc. 


Aunque no existe acuerdo sobre cuánto debe valer, el 

coeficiente a debe tomar un valor de 0,70 como mínimo 






para poder concluir que existe consistencia interna, o que la 
escala multiítem es fiable. 


5. El coeficiente 0 mide lo mismo que a, sólo que en la 
expresión se cambia la correlación media por el primer 
valor propio obtenido cuando se aplica técnica de análisis 
de componentes principales. El valor propio es un indicador 
de la cantidad de información que contiene una 
combinación lineal de variables. 


e = (N/N-l)(l-l/Fi) 

Puesto que el máximo valor que puede tomar es N, se 
deduce que cuando el primer factor recoge todos los ítems, 
la consistencia interna medida por 0 es 1. 


6.4.3. Influencia del diseño de la escala 
sobre la fiabilidad 

El diseño de una escala afecta a su fiabilidad tal como se 
expone en el cuadro-resumen 6.4. Se puede apreciar que la 
fiabilidad depende de la longitud de la escala y del número de 
categorías. 


6.5. VALIDEZ DE LAS ESCALAS 


Una escala es válida cuando mide lo que tiene que medir. Los 
termómetros miden temperaturas y los manómetros presiones. 
Una escala para medir fidelidad tiene que medir fidelidad y una 
escala de riesgo tiene que medir riesgo. Una escala será tanto 
más válida cuanto menor sea el error sistemático. Existen varias 
clases de validez: 

• Validez pragmática. Una escala es válida desde el punto 
de vista pragmático cuando sirve para hacer predicciones 
actuales o futuras. Se habla de validez concurrente y 




predictiva. Un test de inteligencia permite hacer 
predicciones sobre la capacidad intelectual de una persona 
en el presente. Es un instrumento que tiene validez 
concurrente. Un test de actitudes ante el trabajo sirve para 
hacer predicciones sobre el éxito que puede alcanzar en la 
vida. Este test tiene validez predictiva. 

Validez de contenido. Considera si los ítems que 

contiene la escala son adecuados para hacer las 
mediciones. Por ejemplo, un test de inteligencia basado en 
la resolución de integrales no es adecuado por su contenido 
para medir la inteligencia de un niño. Una persona con poca 
formación matemática puntuará peor en un test de 
operaciones aritméticas que otra con conocimientos 
matemáticos avanzados. El contenido de una escala se 
determina buscando ítems adecuados para hacer las 
mediciones, por ejemplo mediante revisiones de literatura, o 
en otras escalas similares o utilizando el sentido común. La 
escala inicialmente propuesta será sometida a juicio de 
expertos para ser cribada. Posteriormente se puede afinar 
más a base de calcular la consistencia interna quitando y 
añadiendo ítems. 


Cuadro 6.4. Influencia del diseño de la escala sobre la 

fiabilidad 


Diseño de la escala 

Efecto sobre la fiabilidad 

Número de ítems 

Aumenta la fiabilidad 

Dificultad de los ítems 

No existen evidencias en uno u otro 
sentido 

Tipo de escala 

No existe, a priori, superioridad de una 
escala multiítem sobre otra 

Número de categorías 

A medida que aumenta se incrementa 
la fiabilidad 

Formato de la escala 

No existen evidencias de que colores, 
gráficos, etc., afecten a la fiabilidad 















Escalas con categorías 
neutras (indiferente) 

No existen evidencias sobre su 
influencia en la fiabilidad 

Adaptado de Churchill (1991, 44 

^3). 


• Validez de concepto. Este tipo de validez guarda relación 
con lo que está midiendo realmente la escala. Se dice que 
una escala posee validez convergente cuando mide lo 
mismo que escalas que miden el mismo concepto. Una 
escala posee validez discriminante cuando sus 
mediciones no guardan ninguna relación con escalas que 
miden conceptos distintos. Por ejemplo, una escala 
elaborada para medir fidelidad a la marca debería 
proporcionar correlaciones elevadas con otras escalas 
alternativas que también miden fidelidad. Las correlaciones 
con otras escalas que no miden fidelidad, por ejemplo 
etnocentrismo o riesgo, deberían ser nulas o no 
significativas. 

• Validez nomológica. Se dice que una escala posee este 
tipo de validez cuando los resultados y conclusiones a los 
que se llega tras su aplicación son consistentes o 
coherentes con teorías. 

A continuación se muestra una escala -según como se midan 
las respuestas podría ser métrica continua o de Likert- que tiene 
cuatro dimensiones: implicación, fidelidad, innovación y riesgo 
de los consumidores. Obsérvese que sus fiabilidades medidas 
por el coeficiente alfa de Cronbach son bastante elevadas y que 
la matriz de correlaciones entre las mediciones hechas con una 
muestra de consumidores son tan pequeñas que puede pensarse 
en validez discriminante entre las subescalas. 

IMPLICACIÓN 

1. Cuando otras personas me ven consumiendo algún 
producto, seguro que se forman una opinión de mí. 

2. El producto que consumo me ayuda expresar quién 
soy yo. 




3. Ver qué productos consumen las personas dice mucho 
de ellas. 

4. Cuando uso el producto, otros me ven como yo quiero 
que me vean. 

RIESGO 

5. Cuando compro un producto me queda la duda de si 
debería haberlo comprado. 

6. Cuando me encuentro frente a un producto, me siento 
algo inseguro para hacer la elección. 

7. Cuando se compra, nunca se está del todo seguro de 
la elección. 

FIDELIDAD 

8. Una vez que elijo un marca tiendo a seguir con ella y 
me olvido de las demás. 

9. Una vez que elijo una marca detesto los cambios. 

10. Si me gusta una marca, raramente cambio por probar 
algo distinto. 

11. Aun cuando un mismo producto esté disponible en 
varias marcas, tiendo a comprar la misma. 

INNOVACIÓN 

12. El arte moderno es estimulante. 

13. Me gusta probar cosas nuevas y diferentes. 

14. Me gusta experimentar nuevas formas de hacer las 
cosas. 


Concepto 

Alfa de Cronbach 

Implicación 

0,8377 

Fidelidad 

0,8961 






Innovación 

0,8360 

Riesgo 

0,8649 


Matriz de correlaciones entre las subescalas: 



Implicación 

Fidelidad 

Innovación 

Riesgo 

Implicación 

1 




Fidelidad 

0,030 

1 



Innovación 

0,049 

0,0548 

1 


Riesgo 

0,029 

0,0149 

0,0401 

1 


6.6. CRITERIOS PARA VALORAR 
LAS ESCALAS 


A lo largo de este capítulo se han expuesto muchas ideas 
sobre las escalas, su construcción, fiabilidad y validez. El cuadro 
6.5 resume criterios para valorar las escalas, porque es muy 
frecuente que los investigadores acudan a examinar estudios 
previos para elaborar sus escalas (Bearden et al, 1993, 7 y 
Robinson et al., 1991, 12). En este cuadro se muestran los 
aspectos a considerar antes de utilizar una escala. Estos 
aspectos son: 

• La consistencia de la escala, avalada por fundamentos 
teóricos o validaciones empíricas. 

• Estudios piloto desarrollados por los investigadores para 
definir los ítems. 

• Pruebas estadísticas realizadas con la muestra. 

• Tipo de muestreo adoptado. 

• Correlación media entre los ítems, estimada a partir de la 
matriz de correlaciones. 

• Valor mínimo del coeficiente a de Cronbach. 

















• Número de factores encontrados en caso de emplear 
análisis de componentes principales para validar la escala. 

• Valor mínimo de la correlación entre ítems y tiempo mínimo 
transcurrido en caso de aplicar test-retest. 

• Influencia del entorno en las mediciones. 

• Validez convergente. 

• Validez discriminante. 

Según estos parámetros, las escalas pueden ser excelentes, 
buenas, regulares, mínimas o sin calificar. 


Cuadro 6.5. Criterios para la valoración de las escalas 


Criterios de 
evaluación 

Calificada 

Excelente 

Calificada 

Buena 

Calificada 

Regular 

Calificada 

Mínima 

Sin 

calificar 

Desarrollos 
teóricos 0 
empíricos 
sobre la 
escala 

Refleja 

investigaciones 
de calidad en 
ese campo de 
conocimiento y 
validaciones 
empíricas 

Presenta 
revisiones de 
literatura o 
validaciones 
empíricas 

Revisa más de 
una fuente 

Revisa una 
fuente 

No se basa en 
nada. 

La escala es 
ad hoc 

Estudios piloto 
para definir 
los Ítems 

Más de 250 
ítems 

inicialmente 
acompañados 
de varios 
estudios piloto 
para depurarlos 

De 100 a 250 
ítems y más 
de dos 

pruebas piloto 

Entre 50 y 100 
ítems y más 
de dos 

estudios piloto 

Se eliminan 
algunos ítems. 
Se realiza un 
sencillo 
estudio piloto 

No se eliminan 
Ítems. 

No se realiza 
estudio piloto 


i-'^image 











Capítulo 7 

Técnicas de selección de 
muestras: El muestreo 


7.1. Objetivos del capítulo. 

7 2. El muestreo. Conceptos fundamentales. 

7.3. Los errores en el muestreo. 

7.4. Tipos de muestreo. 

7.5. Diseño del muestreo. 

7.6. El muestreo aleatorio. 

7.7. Selección real de las unidades de la muestra. 

7.8. Otras clases de muestreo. 

7.9. Ejemplos de muestreo. 


TECNICAS DE SELECCION 

DE MUESTRAS: EL 
MUESTREO 


7.1. OBJETIVOS DEL CAPÍTULO 

Tras la lectura de este capítulo el lector adquirirá un conjunto de 
conocimientos necesarios para diseñar las tareas de muestreo. En concreto 
sabrá: 

• Qué procedimientos de muestreo existen. 

• Cómo se diseña un muestreo probabilístico. 

• Cuándo se emplea muestreo no probabilístico. 

• Ventajas e inconvenientes de los diversos tipos de muestreo. 

• Cómo se estiman los tamaños de las muestras. 

• Cómo se estiman los errores de muestreo. 

• Cómo se seleccionan las unidades muéstrales. 

• Cómo se combinan los métodos de muestreo. 

• Aplicaciones concretas de los métodos de muestreo expuestos. 


7.2. EL MUESTREO. CONCEPTOS 
FUNDAMENTALES 








En este libro se han detallado las téenicas de reeogida de informaeión. La 
mayoría de ellas parten del estudio de una muestra o parte de la poblaeión. En 
este apartado se comienza a tratar la selección de muestras con detenimiento. 
Pero antes es necesario definir una serie de conceptos. Son los siguientes. 

• Población. Se denomina población a una colección finita o infinita de 
unidades (individuos o elementos) de las cuales se desea obtener una 
información. Las unidades de la población pueden ser familias, 
empresas, personas, amas de casa, etc. En cada unidad es posible medir 
distintas características, o clasificarla con arreglo a éstas. Por ejemplo, 
se puede medir la edad, el nivel de renta, la posición, la actitud hacia un 
producto, la compra mensual en euros, etc. 

• Unidades de muestreo. Es el elemento o elementos que se encuentran 
disponibles para su selección. Pueden coincidir, o no, con las unidades de 
la población. Por ejemplo, si la población está compuesta por el censo de 
empresas y se seleccionan empresas, ambas coinciden. Ahora bien, si la 
población está compuesta por las familias, en una primera etapa se 
pueden elegir ciudades y en una segunda etapa las familias: en la 
primera, las ciudades son las unidades muéstrales, pero no lo son las 
unidades de la población. 

• Marco. Para poder seleccionar la muestra se necesita disponer de un 
marco. Marco, en sentido estricto, es la lista de las unidades de muestreo 
y debe ser tal que: 

1. Cada elemento de la población figure en él. 

2. Cada elemento de la población figure una sola vez. 

3. Sólo contenga los elementos de la población. 

En un sentido más amplio, marco es toda aquella información que pueda ser 
utilizada para elegir la muestra produciendo resultados semejantes a los de una 
lista. Por ejemplo: mapas, listas de clientes, listados de empresas, guía 
alfabética de teléfonos, etc. 

Así, en un estudio de la posible demanda en Castilla y León de una central 
de datos diseñada para empresas, el marco se especificará de esta forma: 



1. Población: las empresas. 

2. Unidad de muestreo: empresa. 

3. Aleanee: Castilla y León. 

4. El mareo será la lista de empresas, o eenso industrial. 

• Muestra. Se denomina muestra a una parte de las unidades que forman la 
poblaeión y del mareo. A partir de la muestra se pueden inferir o estimar 
las earaeteristieas de la poblaeión, eomo la media de eonsumo por 
unidad, el poreentaje de unidades que poseen determinadas 
earaeteristieas, ete. Generalmente se trata de estimar medias, 
proporeiones y totales. 

7.3. LOS ERRORES EN EL 
MUESTREO 


Cualquier tipo de muestreo apareja alguna elase de error, debido a que no se 
estudia toda la poblaeión, sino una parte de ella, o muestra. Este error puede 
aeotarse y redueirse diseñando la muestra eon rigor. Por ejemplo, si se estima 
que el poreentaje de familias que eonsumen un determinado produeto es del 
20%, y la muestra fuera representativa, es posible que el verdadero valor esté 
próximo a esta magnitud, pero es difíeil que sea exaetamente el 20%. La 
difereneia entre el valor estimado y el valor deseonoeido, pero real, de la 
poblaeión, es lo que se denomina error, que se representa eon la letra «e». 

Cuando se estima que el poreentaje de familias que eonsume un produeto es 
del 20%, un error del 2%, eon una eonfianza del 95,5%, está expresando que se 
tiene una seguridad del 95,5% de que el verdadero valor pertenezea al 
intervalo 18-22%. Es deeir, la eonfianza indiea que de eada 100 veees que se 
repita todo el proeeso, en 95,5 de ellas la estimaeión será aeertada. 

Existen otras fuentes de error distintas del error de muestreo. Se denominan 
errores sistemátieos, ajenos al muestreo, o sesgos. Pueden redueirse diseñando 
eon euidado el proeeso de muestreo. 



Cuadro 7.1. Errores en el muestreo 


Clases de 

error 

Fuentes de error 

Características del error 

Aleatorio o 
propio del 
muestreo 

• El error existe porque se 
estudia una muestra, no 
toda la población 

• El parámetro (renta 
media, proporción de 
consumidores, etc.) 
varía de una muestra a 
otra 

• No se puede eliminar 

• Se puede acotar el 
error 

• Depende del tamaño de 
la muestra 

• Decrece si la muestra 
se amplía 

• Es menor cuanto más 
homogénea sea la 
población 

Sistemático 

0 ajeno al 
muestreo 

• La muestra no es 
representativa porque 
ha sido mal 
seleccionada 

• Se puede reducir de 
forma importante 
cuidando los detalles 

• Crece con el tamaño de 


• La muestra no se puede 
localizar bien 

• La muestra se niega a 
responder 

• Algunos grupos (la clase 
media) son más 
proclives a responder 

• Falta de exactitud de las 
respuestas por 
incapacidad para emitir 
una respuesta, por mala 
memoria, suposiciones 
sesgadas, mentiras, etc. 

• Preguntas mal 
redactadas 

• Cuestionarios 
defectuosos 


la muestra 

• Los errores ajenos al 
muestreo no se pueden 
acotar 

• Los errores se pueden 
reducir planificando bien 
la selección de la 
muestra; dando 
instrucciones claras y 
precisas; 
proporcionando 
cuestionarios 
redactados con 
precisión y fáciles de 
responder; 

seleccionando personal 
muy cualificado. 












• El entrevistador 
introduce sesgos. 

• Los encuestadores no 
son competentes 

• Errores de anotaciones, 
de correcciones, en 
tabulaciones, etc. 

Fuente: Elaboración propia. 

7.4. TIPOS DE MUESTREO 

Se denomina muestreo al proeedimiento mediante el eual se obtiene una 
muestra. La muestra debe ser representativa de la poblaeión que se desea 
estudiar y reflejar las earaeteristieas de los elementos que la eomponen. 
Solamente en este easo se pueden inferir los resultados de la muestra a la 
poblaeión, de ahi la importaneia del proeedimiento mediante el eual se 
seleeeiona la muestra. Existen varias elases de muestreo, que se pueden 
resumir en dos grandes grupos: muestreo probabilístico y no probabilístico. 

7.4.1. Muestreo no probabilístico 

En él, las unidades muéstrales no se seleeeionan al azar, sino que son 
elegidas por las personas. Los diversos tipos de muestreo no probabilistieo 
tienen las siguientes earaeteristieas eomunes. 

• La selección de la muestra no es aleatoria, sino que se basa, en parte, 
en el juieio del entrevistador o del responsable de la investigaeión. 

• No se basa en ninguna teoría de la probabilidad y, por lo tanto, no es 
posible ealeular la preeisión o aeotar el error eometido. 

• No es posible calcular estos errores ni la confianza de las estimaciones 

que, además, no siempre se redueen aumentando el tamaño de la 
muestra. 




• En el muestreo no probabilístico los costes y la dificultad del diseño 
son más reducidos (al no ser neeesario disponer de un mareo). Este 
muestreo puede dar buenos resultados, pero también apareja el riesgo de 
proporeionar una informaeión errónea. 

Existen varios procedimientos de muestreo no probabilistico, tal como se 
recoge en el cuadro 7.2. 


Cuadro 7.2. Principales clases de muestreo no probabilístico 


Clase de muestreo 

Características 

Ejemplos 

Utilidad 

Conveniencia. Las muestras se 
seleccionan según un 
criterio de accesibilidad o 
comodidad 

• Comodidad en 
la selección de 
la muestra 

• Rapidez 

• Economía 

• Encuestas a 
estudiantes en 
clase 

• Encuestas en 
establecimien¬ 
tos comerciales 

• Diseño inicial de investigaciones 

• Investigaciones exploratorias 

• Formulación de hipótesis 

• Validación de escalas 

• Cálculo de vananzas para la 
afijación en el muestreo 
aleatorio estratificado 


Según el criterio. La muestra 
es elegida por un experto de 
acuerdo con su criterio, 
buscando las unidades más 
representativas. 

• Rapidez. 

• Economía. 

• Seleccionar 
ciudades para 
hacer algún test 
de mercado o 
de producto. 

• Seleccionar una 
muestra de 
personas en 
una empresa. 

• Se emplea cuando el tamaño 
de la muestra es pequeño. 

Diseño de bola de nieve. Cada 
unidad muestral es localizada 
por indicación de otra persona, 

• Comodidad en 
la selección de 
la muestra. 

• No tiene por qué 
ser rápido. 

• No tiene por qué 
ser cómodo. 

• Identificar una 
muestra de 
dueños de 
perros 
pequineses. 

• Identificar una 
muestra de 
aficionados al 
parapente. 

• Se emplea cuando se trata de 
estudiar poblaciones 
pequeñas muy especializa¬ 
das, que son difíciles de loca¬ 
lizar por no existir censos o 
ser inaccesibles. 

Secuencial. La muestra inicial, 
reducida, se incrementa hasta 
alcanzar las cuotas deseadas. 

En ese momento se deja de 
recoger información. 

• No tiene por qué 
ser rápido. 

• No tiene por qué 
ser cómodo. 

• Estudios de 
comportamien¬ 
to del consumi¬ 
dor en general. 

• Se aplica en investigaciones 
en su fase inicial. 

Posteriormente se acude a 
muestreo aleatorio. 


Fuente: Elaboración propia. 














7.4.2. Muestreo probabilístico 

En el muestreo probabilístieo se seleeeionan las unidades muéstrales a 
través de un proeeso de azar, aleatorio. Los distintos tipos de muestreo 
probabilistieo tienen las siguientes earaeteristieas: 

• Las muestras se seleeeionan al azar, no se seleeeionan por los 
investigadores. 

• Cada elemento de la poblaeión tiene la misma probabilidad de ser 
elegido. 

• Se puede eonoeer el error y la confianza de las estimaeiones. 

• Los resultados se pueden generalizar. 

• Es el únieo método que puede evaluar la representatividad de la 
muestra. 

• Es más caro que el muestreo no probabilistieo. 

• Es, en general, más lento y complicado que el muestreo no 
probabilistieo. 

Si en la poblaeión se pueden difereneiar grupos de tal forma que su 
eomportamiento respeeto a la variable a estudiar sea homogéneo en eada 
grupo y muy diferente de un grupo a otro, se puede lograr mayor preeisión 
obteniendo una muestra estratifieada. Entonees se habla de muestreo 
aleatorio estratificado. Por ejemplo, si se quisiera estimar la posible 
demanda de una granja de earaeoles, se podría pensar en tres tipos de elientes. 
Los mayoristas, los restaurantes y los eonserveros. Se obtendría una mayor 
preeisión si se obtuviera una muestra independiente en eada uno de estos tres 
grupos. Una muestra estratifieada se seleeeiona de la siguiente forma: 

• Se divide la poblaeión en subgrupos o estratos, de forma que éstos sean 
homogéneos. Cada estrato tiene un tamaño Njj y su suma es igual al 
tamaño de la poblaeión N. 


Los estratos son excluyentes, de manera que eada individuo de la 
poblaeión pertenezea a un estrato y sólo a uno. 



De cada uno de los estratos se obtiene una muestra aleatoria simple, de 
tamaño n^, independiente en cada uno de los estratos. El tamaño total de 
la muestra es la suma de los tamaños de las muestras de los estratos, n. 

Los criterios de selección de los estratos deben estar relacionados con el 
objetivo del estudio. Asi, por ejemplo, si se quiere estudiar la 
proporción de jóvenes que consumen alcohol, la estratificación será 
según el nivel de edad, ya que se puede esperar que a los 15 años dicho 
consumo sea diferente que a los 25 años. 

La variable de estratificación es el criterio que permite definir los 
estratos. Debe ser objetiva e identificable. Por ejemplo, los criterios de 
estratificación más usuales en investigación comercial son: sexo, edad, 
hábitat, clase social, nivel profesional, número de hijos, zona geográfica, 
tamaño del establecimiento, etc. Para estratificar no se podria utilizar 
una variable como la actitud o la opinión. 

El muestreo estratificado permite obtener una estimación más precisa de 
los parámetros de la población, pero además proporciona estimaciones 
de los parámetros en cada estrato. En el ejemplo de la granja de 
caracoles se obtendrá la demanda de los restaurantes, de los mayoristas y 
de los conserveros. 

Otra ventaja del muestreo estratificado es que se puede dar un 
tratamiento diferente a la población en cada estrato. Por ejemplo, si para 
un estudio de opinión sobre una revista se consideran dos estratos, el de 
los lectores y el de los anunciantes, se pueden dar dos tratamientos 
diferentes. En el primer caso recoger la información mediante encuesta 
postal con el incentivo de un sorteo y en el de los anunciantes mediante 
encuesta telefónica. 

El mayor inconveniente del muestreo estratificado es el diseño. Para 
planificarlo es necesario tener bastante información sobre algunos 
aspectos de la población, para poder diseñar los estratos, y disponer de 
un marco en cada uno de ellos. 



En cuanto al número de estratos, no existe ninguna norma preeisa. En 
general, si los estratos están bien definidos, euanto mayor sea su número, 
mayor es la preeisión, pero euanto mayor es el número de estratos, más difícil 
son el diseño y los cálenlos. 


Cuadro 7.3. Principales clases de muestreo probabilístico 


Tipo de muestreo 

Características 

Ejemplo de 
aplicaciones 

Utilidad 

Aleatorio simple: todos 
los elementos de la 
población tienen la 
misma probabilidad de 
ser elegidos. 

• Sendtez de selección de muestras. 

• Todos los individuos tienen las 
mismas probabilidades de ser 
seleccionados. 

• Se puede medir y acotar el error 

0 la precisión. 

• Requiere una localización previa 
de todos los elementos de la 
población. 

• Selección por 
teléfono de una 
muestra para 
conocer audiencias. 

• Obtención de una 
muestra de perso¬ 
nas para conocer la 
proporción de 
fumadores. 

Se emplea para hacer 
estimaciones en 
poblaciones 
homogéneas. 

Aleatorio estratificado: 
considera la existencia 
de grupos con 
diferentes 
comportamientos 0 
características. 

• Mayor complejidad en el diseño 
del muestreo. 

• Necesidad de conocer el peso 
relativo de cada estrato. 

• Mayor precisión en las 
estimaciones. 

• Posibilidad de obtener 
estimaciones en los estratos, 
aunque con menor precisión que 
en la población. 

• El tamaño de la muestra es 
menor que el necesario para 
obtener la misma precisión con 
un muestreo aleatorio simple. 

• Intenciones de voto. 

• Comportamientos 
en función del 
hábrtat, edad, sexo, 
nivel 

socioeconómico. 

• Se emplea cuando 
las poblaciones son 
heterogéneas en su 
composición o 
comportamiento 
pero existen grupos 
homogéneos 
definidos por una 
característica 
controlable. 


Fuente: Elaboración propia. 


7.5. DISEÑO DEL MUESTREO 


La representatividad de una muestra depende del procedimiento eon que se 
ha elegido, de ahi la importancia de haeer un diseño euidadoso del muestreo. 
Un buen diseño puede obtener mayor representatividad que muestras más 
grandes obtenidas eon otros procedimientos. Se deben seguir los siguientes 
pasos: 








1. Definir la población. Es necesario identificar correctamente la 
población objetivo. Si se tratara de un sondeo hay que decidir a quién 
hay que preguntar: amas de casa, personas mayores de 18 años... Para 
ello hay que tener en cuenta los objetivos de la investigación. Por 
ejemplo, si se quieren conocer las reacciones de los votantes 
españoles hacia cierta medida politica, la población serán las personas 
mayores de 18 años. Si se quieren conocer las actitudes hacia una 
espuma de afeitar, la población serán varones, etc. 

La definición de la población incluye, además, la especificación de la 
unidad de muestreo, el alcance geográfico de la investigación y el 
momento o periodo de tiempo en que se realiza el estudio. Por 
ejemplo, en un estudio sobre el porcentaje de jóvenes catalanes que 
fuman, la unidad de muestreo serán los jóvenes entre 12 y 25 años, el 
alcance geográfico seria Cataluña y se fijarla para realizarlo el 
periodo correspondiente a las dos primeras semanas de marzo. 

2. Identificar el marco o lista completa de las unidades muéstrales. No 
siempre se dispone de una lista completa de las unidades de la 
población. Este problema se puede resolver, a veces, recurriendo a un 
muestreo por etapas. De esta forma, en lugar de confeccionar una lista 
de todos los comercios de deportes del pais para elegir una muestra, 
se pueden elegir inicialmente diez ciudades y confeccionar la lista de 
establecimientos en ellas, eligiendo posteriormente las tiendas en 
estas diez ciudades. Otras veces se acude a marcos aproximados. Por 
ejemplo, para obtener un marco de la población de familias se puede 
acudir a un censo de viviendas, pero éste puede tener dos años de 
antigüedad y no incluir las viviendas de nueva creación. 

Lo más habitual es considerar la población que no ha sido recogida en 
el marco y los perjuicios que pueda causar. Según cuál sea el objetivo, 
este riesgo de no-inclusión puede ser, o no, importante. En el caso de 
viviendas nuevas no tendria efecto sobre el consumo de gel, pero 
podría ser importante sobre el de un electrodoméstico. 

3. Determinar el método de muestreo. Podrá ser no aleatorio, aleatorio, 
estratificado, por etapas, etc. Para elegir el procedimiento hay que 
tener en cuenta no sólo las caracteristicas de la población (si existen 



grupos), sino también la forma mediante la eual se va a reeoger la 
informaeión. Por ejemplo, si se va a haeer una eneuesta a los 
suseriptores de una revista mediante eneuesta postal o telefóniea, se 
puede haeer aleatorio. Pero si va a ser eneuesta personal, se puede 
aeudir a un muestren por etapas y en la primera fase elegir eiudades. 
De esta forma se eoneentran geográfieamente las eneuestas y se 
reduee el eoste. 

4. Determinar el tamaño de la muestra. No es eierta la idea de que una 
muestra mayor proporeione siempre mejores resultados. A partir de 
eierto tamaño, inerementarla apenas reduee el error y, sin embargo, 
aumentan los eostes y pueden aumentar los errores ajenos al 
muestren. La investigaeión eomereial debe busear un eompromiso 
entre el eoste de una muestra grande y la fiabilidad de los resultados. 
Existen distintos métodos para determinar el tamaño muestral. 

5. Selección material de la muestra. La selección requiere, por un lado, 
elegir los componentes de la muestra (se suele hacer mediante 
números aleatorios, sistemática, etc.) y, por otro, localizar 
materialmente la muestra, es decir, la localización física de las 
unidades. Cuando se trata de poblaciones humanas es complicado, ya 
que no se encuentran de forma permanente en un lugar determinado 
como ocurre con las empresas o piezas en un almacén. 

6. Decidir el trato que se ha de dar a la falta de respuestas. En muchos 
casos no se puede obtener la información de una unidad de la muestra 
por distintas causas: porque se niega a responder, no se localiza, no 
sabe contestar o no es accesible. La falta de respuesta es un problema 
serio, porque en muchos casos puede sesgar los resultados, máxime 
cuando puede ser señal de una actitud determinada. Por ejemplo, en 
una encuesta sobre inquietudes culturales responden más las personas 
con mayor nivel cultural, o interés. En cada caso hay que valorar cuál 
puede ser este riesgo y tratar de solucionar el problema. Para 
reducirlo al mínimo se pueden intentar varios procedimientos. 

a. Mejorar el diseño de la investigación para reducir las negativas. 

Por ejemplo, llamar por teléfono para solicitar que respondan a 



un cuestionario escrito, introducir incentivos para las 
respuestas, etc. 

b. Repetir los intentos; por ejemplo, llamar varias veces por 
teléfono a distintas horas, o realizar varias veces la visita. 

c. Estimar los efectos de la falta de respuesta en lo que respecta a 
la calidad de la información. 


7.6. EL MUESTREO ALEATORIO 


Cuando se obtiene una muestra se busca estimar un parámetro de la 
población. Generalmente es una media, una proporción o un total. Para ello se 
utiliza una función de los valores muéstrales o estimador. Los estimadores son 
aleatorios. No todas las muestras proporcionan el mismo valor para un 
estadístico. Si se tiene una población de 100 personas y se quiere estimar su 
renta media a partir de una muestra de tamaño 10, pueden obtener muchas 
muestras diferentes, aproximadamente igual a 1,73.10^^. Cada una 
proporcionará una media, y no todas serán coincidentes. 

Consideremos una población formada por seis establecimientos comerciales 
de una ciudad que venden una marca de videos. La tabla siguiente recoge las 
ventas mensuales de videos en cada uno de los establecimientos. 


Establecimientos 

Ventas en el último mes 

a 

8 

b 

10 

c 

6 

d 

10 

e 

10 

f 

9 


Si se calcula la media mediante una muestra de tamaño n ^ 3, por ejemplo 
la compuesta por a, c, d. 



J = JÍ±Ü±1^=8 

3 


Si la muestra está eompuesta por d, e, e, la media será a ^ 8,6, mientras que 
la verdadera media de la poblaeión es a ^ 8,8 

Esta media real es generalmente deseonoeida; es el parámetro de la 
poblaeión, la que se quiere estimar a través de la media muestral. La media 
muestral varia de una muestra a otra. Si la poblaeión es muy heterogénea, esta 
variaeión será mayor que si es homogénea. En el easo extremo de que todas las 
unidades fueran iguales, todas las muestras darían el mismo resultado. Si la 
muestra es pequeña, puede eontener valores extremos y su influeneia sobre el 
parámetro será importante, mientras que si la muestra es grande, este valor se 
promedia eon otros muehos y su influeneia será menor. Pareee lógieo pensar 
que euanto mayor sea la muestra más pareeidos serán los resultados. 

En eonseeueneia, el estimador, ya sea la media u otro eomo la proporeión, el 
total, ete., es aleatorio. Al tomar diferentes muestras se obtendrían valores 
repetidos. Con mueha freeueneia se obtienen valores próximos al valor 
poblaeional, y los valores alejados son raros. Por lo tanto, tiene una 
distribueión de probabilidad. La estadistiea teóriea nos diee que esa 
distribueión, bajo eiertas eondieiones, tiene forma de eampana. Es la 
distribueión Normal. 



La figura representa la distribueión de probabilidad de la media muestral 
para dos tamaños muéstrales diferentes n^, n 2 siendo n 2 >ni. 

Cuanto mayor sea n, más pareeidas serán las estimaeiones obtenidas eon 
distintas muestras, es deeir, la varianza (o medida de la dispersión) del 
estadistieo será menor. Esta varianza depende de la varianza de la poblaeión 
(heterogeneidad de la poblaeión) y del tamaño muestral. 






Si de una población de tamaño N se extrae una muestra de tamaño n, Xj, 
representa el valor que toma en el individuo i la variable o característica que 
se estudia; si es dicotómica valdrá 1 cuando posee la caracteristica y cero en 
caso contrario. P representa la proporción -desconocida- de individuos que 
poseen la caracteristica en la población. Q ^ 1 - P. representa la 
cuasivarianza de la población, es una medida de su heterogeneidad. 

k es una constante que depende del nivel de confianza. Si la confianza es 
95,5%, k ^ 2; si la confianza es 99,7%, k = 3 


7.6.1. Muestreo aleatorio simple 


El cuadro 7.4 recoge los estimadores de la media y la proporción y sus 
características. 


Cuadro 7.4. Estimadores de la medía y de la proporción 
en muestreo aleatorio simple 


Parámetro 
a estimar 

Estimador 

Varianza del 
estimador 

Intervalo de 
confianza 

Mctlia 

Media de la muestra 

n 

^ " 

yV - /» S'- 

var.v = - 

■V n 

< 

.X ±t’] = |.v±A. Vva 

1- TT' 

.xtA'il- 

\ N II 

A 

deudo S- la estima 
le S- 

ción 

Pro[X)rción 

Proporción en la 
muestra 

. . PQ 

N I n 

> 

p±e ' plkyjysit p = 

/yV-u p-í/ 

pik.i -, 

\ .\' II 1 

dendo q = 1 p 



En el cuadro se muestra cómo obtener las estimaciones y el error cuando se 
dispone de una muestra. Cuando se diseña un muestreo, el investigador debe 
decidir el tamaño de la muestra. Para ello fija el error máximo que está 
dispuesto a admitir, «e», en las mismas unidades del parámetro que estima, y 
la confianza que desea, generalmente el 95,5%, lo que determina el valor de k. 



















La teoría del muestreo proporeiona fórmulas para ealcular los tamaños de 
las muestras 

Cuadro 7.5. Métodos analíticos para estimar tamaños de 

muestras 


Parámetro a 
estimar 

Tamaño de la 
muestra 

En qué hay que fijarse 

Media 

Población finita 

N 5-’ 

Fijado el error, «e», n, el tamaño de la 
muestra aumenta con: 

• El tamaño de la población N. 

• La heterogeneidad de la población 
(S2). 

• Confianza deseada, que determina 
el valor de k. 

/í ” 

e~N + k-S~ 
Población infinita 

k- 

Proporción 

Población finita 
k- PQN 

Fijado el error, «e», n aumenta con: 

• El tamaño de la población N. 

• La heterogeneidad de la población 

(P-Q) 

• Confianza deseada, que determina 
el valor de k. 

e-(N-¡) + k-PQ 

Población infinita 

k- FQ 
n =-^ 


Según lo expuesto, el tamaño de la muestra ereeerá de una poblaeión de 
1.000 individuos a una de 10.000, pero no variará entre una población de 5 
millones y otra de 10 millones. 

Supongamos que se pretende estimar la renta media anual de una manzana 
de casas de Zamora cuyo censo es 100 familias, con un error máximo de 500 
euros y una confianza del 95,5%, si la cuasivarianza estimada de la población 
es de 20 millones^. El tamaño muestral necesario es n ^ 76 familias. 


100X4 X20.000.000 

n =-= 76 

5(XP X 100^4 xIOAKXhOOO 













Si la muestra fuera para la ciudad, con 50.000 familias, con los mismos 
objetivos y variabilidad, la muestra es n ^ 318, y si la población fuera de 3 
millones n = 320. 

Igualmente se puede ver que, para una población dada, al aumentar la 
muestra no se reduce el error en la misma proporción. 

Para la aplicación estricta de la fórmula que proporciona n se necesita tener 
bastante información: el tamaño de la población y la variabilidad. 
Generalmente en los casos reales no se dispone de un valor exacto de y 
debe ser estimado utilizando algún método aproximado como los siguientes: 

• Estimación obtenida en una encuesta previa o en una población 
semejante. 

• Estimación obtenida en una muestra piloto. 

• Estimación de de forma subjetiva: por ejemplo, si se cree que en un 
pais el 95,5% de las familias tienen unos ingresos anuales entre 
1.000.000 y 10.000.000 y suponiendo que se distribuyen según una ley 
normal, la amplitud de ese intervalo es de 4 veces la desviación 4 VarX ^ 
9.000.000. De ahi se puede obtener una estimación subjetiva de VarX = 
2,2 millones. 

• Ponerse en el peor de los casos, el que proporciona mayor varianza. Este 
seria cuando la mitad de la población toma el valor más pequeño, por 
ejemplo, 1 millón, y la otra mitad el valor más alto, 9 millones. 
Entonces, la media se estima en 5 y la varianza en 


(I -5p^ + (9-3)-^ = varX 


Esta estimación es conservadora en el sentido de que obtendremos una 
sobreestimación de la varianza y, por lo tanto, un n mayor del necesario, y la 
precisión será mayor que la deseada. 

En estos dos últimos puntos se estima la desviación y la varianza 

N - ! 

poblacionales respectivamente. La expresión 5- =-var X proporciona la 




estimación de S^. 


Si se estima la proporción de españoles que están a favor de una propuesta 
con una muestra de tamaño 1000, con una confianza de 95,5%, se obtiene un 
error, en el peor de los casos, en el que la varianza es mayor P ^ Q ^ 1/2 


2 = p pí/5 == í 2 % 

V 1000 

si ampliamos la muestra al doble n ^ 2000, el error es 2,24%. Se reduce en 
menos del 1%. 

Las fórmulas son difíciles de aplicar y en la práctica se actúa conforme a su 
lógica, como se ha indicado. Existen otros métodos prácticos para calcular 
tamaños de muestras que no fijan un error, pero se puede calcular el error una 
vez estimado n. 


Cuadro 7.6. Métodos prácticos para determinar tamaños de 

muestras 


Método 

En qué consiste 

Buscar representatividad. Para 
ello se tiene en cuenta el grupo 
menor y se toma una muestra que 
permita obtener un tamaño 
suficiente de este grupo. 

Conseguir un número suficiente de 
cada grupo considerado. 

Ajustarse a un presupuesto. 

Si el presupuesto sólo permite 
obtener una muestra de tamaño n, 
se tendrá que estudiar si la 
representatividad de una muestra 
de este tamaño merece la pena, 
es decir, si el error no es 
excesivo. 

Basarse en otras experiencias. 

Se determina el tamaño de la 
muestra de estudios semejantes 

Fijarse en la representatividad de 
la muestra habitual en ese tipo de 
estudios. En test de producto se 











que hayan logrado una buena 
representatividad. 

suelen usar muestras entre 200 y 
500 personas. 

Según resultados iniciales. 

Se puede comenzar con una 
muestra pequeña y obtener una 
estimación con un error grande: si 
esta estimación no está muy 
alejada del valor crítico sería 
suficiente, en caso contrario se 
amplía la muestra. 


Fuente: Elaboración propia. 


7.6.2. Muestreo estratificado 


En el diseño del muestreo estratificado no sólo hay que decidir sobre el 
tamaño de la muestra n, sino también sobre el reparto por estratos n^j. Este 
reparto se denomina afíj ación. Existen distintas formas de realizar la 
afíj ación: 


Cuadro 7.7. Clases de afijación 


Afijación 

Tamaño de la muestra en cada estrato 

Simple. En todos los 
estratos se obtiene una 
muestra de igual tamaño. 

n-| = ... = n^ = ... = n|_ = n/L. 

Proporcional. El tamaño 
muestral de cada estrato 
está en proporción al 
tamaño del estrato. 

= ... = —^ = ... = —^de donde n,, = n —- 
N, N„ N, N 

Óptima. La afijación o el 
tamaño en cada estrato 
depende del tamaño del 
estrato y de la 

heterogeneidad del estrato 
S^h (cuasivarianza del 
estrato). 

n, = * * 

siendo 5'^^ cuasivarianza del estrato h 


Fuente: Elaboración propia. 













En general se eumple que la afijaeión óptima es más preeisa que la 
proporeional y ésta más que la afijaeión simple (obsérvese que si todos los 
estratos tienen la misma euasivarianza, la afijaeión óptima eoineide eon la 
proporeional). El problema de la afijaeión óptima es que para su diseño se 
neeesita mayor informaeión que para la proporeional. Es neeesario eonoeer no 
sólo el tamaño del estrato, sino también su variabilidad S^. En la práetiea no se 
suele eonoeer este parámetro y se reeurre a proeedimientos aproximados, igual 
que para la estimaeión de en el m.a.s., eomo eneuestas piloto, métodos 
subjetivos, ete. 

Supongamos que una poblaeión tiene 80.000 habitantes, que se pueden 
elasifiear en jóvenes, adultos y mayores y que la proporeión de estos grupos 
fuera 35%, 40% y 25%, respeetivamente. Supongamos también que el tamaño 
total de la muestra debe ser de 1.000 personas. Esta se puede repartir mediante 
afijaeión simple, proporeional y óptima. 

La afijaeión simple divide la muestra en submuestras de igual tamaño. En el 
ejemplo, se tomarían 333 personas de eada grupo. La afijaeión proporeional 
toma submuestras en proporeión al peso de eada subgrupo. En este easo 350 
jóvenes, 400 adultos y 250 mayores. La afijaeión óptima seleeeiona las 
submuestras en proporeión al tamaño de su estrato y su homogeneidad. Cuanto 
más homogéneo sea, menor será el tamaño de la submuestra eorrespondiente. 
La afijaeión promoeional suele apliearse en muestren para estimar 
proporeiones. 

El tamaño de las submuestras debe ser proporeional a las dispersiones 
dentro de eada grupo. Si en el ejemplo que estamos empleando la 
euasivarianza del eonsumo de tabaeo de los subgrupos fuera, 20 para los 
jóvenes, 40 para los adultos y 30 para los mayores, el tamaño óptimo de las 
submuestras para haeer un estudio sobre eonsumo de tabaeo seria: 

ni - [1.000/(20+40+30)]20 - 222 
n2 - [1.000/(20+40+30)]40 - 444 
n3 - [1.000/(20+40+30)]30 - 333 

Asi, el número de jóvenes de la muestra es n^ ^ 222, el de adultos n 2 ^ 444 y 
el de mayores n 3 ^ 333. Los pesos en la muestra son, respeetivamente. 



22,22%, 44,44% y 33,33%. Los mayores han visto alterada su participación y 
los adultos la han incrementado en detrimento de los jóvenes. Dentro de cada 
estrato, la muestra se selecciona mediante muestren aleatorio simple. 

Las estimaciones en cada estrato se realizan como el muestren aleatorio 
simple. Las estimaciones de la población se obtienen por ponderación de las 
de los estratos. La afijación óptima suele aplicarse para estimar medias 

En los cuadros 7.8 y 7.9 aparecen las fórmulas de los estimadores y de los 
tamaños de las muestras. 

Cuadro 7.8. Estimadores de la media y de la proporción en 

muestreo estratificado 


Parámetro 

Estimador 

Intervalo de 
confianza 

Media 

L 

A' = ¿ —— X, 

N 

siendo la media de la muestra en 

el estrato h 

(.v±e)- 



Proporción 

^image 

siendo pf^ la proporción de la muestra 
en el estrato h 

(p ±k)^ tíimage 


Cuadro 7.9. Tamaños de muestra en muestreo estratificado 


Parámetro 

Tamaño de la muestra 

En la práctica 

Media 

^image 

siendo la cuasivarianza del 

estrato h 

l^image el peso del estrato en la 
población 

l^mage el peso del estrato en la 
muestra 

Dada la dificultad de 
aplicar las fórmulas, 
se suele calcular el 
tamaño de muestra en 
m.a.s y se reparte 
entre los estratos. El 
error será inferior al 
fijado para obtener n. 


















Proporción 


l^image 


Dada la dificultad de 
aplicar las fórmulas, 
se suele calcular el 
tamaño de muestra en 
m.a.s y se reparte 
entre los estratos. El 
error será inferior al 
fijado para obtener n. 


7.7. SELECCIÓN REAL DE LAS 
UNIDADES DE LA MUESTRA 


El cuadro 7.10 recoge y explica diversos procedimientos para seleccionar 
los individuos de una muestra. 


Cuadro 7.10. Procedimientos para seleccionar muestras 


Procedimiento 

En qué consiste 

Características 

Números 

aleatorios 

Asignar números 
consecutivos a los 
elementos de la población 
y generar números 
aleatorios mediante 
ordenador. 

Es necesario un censo o 
lista 

Selección 

sistemática 

Consiste en tomar cada 
unidad késima del 
muestreo [#.!¡image 
después de un n arranque 
aleatorio entre el 1 y el K. 
Por ejemplo, una muestra 
de 400 personas en una 
población de 100.000. El 
salto es K = N/n = 
100.000/400 = 250. Si el 
arranque al azar fuera 

156, la selección serían 
los individuos 156, 156 
más 250, 156 más 500, 

156 más 750 es decir el 

• Es más fácil de 
supervisar. 

• Permite también hacer 
selecciones con 
probabilidades 
proporcionales al 
tamaño de los bloques 

0 ciudades. 

• Este muestreo suele 
obtener muestras 
proporcionadas ya que 












Selección de 

números 

telefónicos 


Selección 
mediante rutas 
aleatorias 


arranque + k * s, siendo s 
= 0,1,2 hasta n-1 y k el 
salto. 


Se seleccionan números 
de la guía telefónica 
mediante procedimiento 
sistemático y luego se 
sustituye la última cifra del 
número seleccionado por 
un dígito aleatorio. 

• Se obtiene 
aleatoriamente una 
serie de puntos o de 
direcciones de la 
ciudad de la cual se 
desea tomar una 
muestra. 

• Estas direcciones son 
los puntos de partida 
de cada ruta. 

• El itinerario se 
construye de manera 
que esté totalmente 
determinado, se traza 
una ruta a seguir. 

• Los edificios 
seleccionados serán 
aquellos situados en la 
ruta y cuyo número de 


se reparte 

uniformemente por una 
población. 

• Una muestra 

sistemática extraída a 
través de un marco 
ordenado, según una 
variable de 
estratificación es una 
muestra estratificada 
con afijación 
proporcional. 


El entrevistador recibe 
instrucciones de forma 
que: 

• No toma decisiones 
personales y no 
selecciona las unidades 
más cómodas. 

• Todos los elementos 
de la población tengan 
la misma probabilidad 
de ser elegidos. 

• Si los puntos de 
partida son aleatorios, 
con rutas que eliminen 
la subjetividad del 
entrevistador, el 
resultado será una 
muestra aleatoria. 









portal coincida con la 
cifra indicada en la hoja 
de ruta. 

Fuente: Elaboración propia. 

Selección de personas en viviendas. Método Kish. En las encuestas 
realizadas mediante entrevista en la vivienda, con frecuencia es un 
entrevistado, generalmente el ama de casa, el que proporciona la información 
de toda la familia o bien se necesita que sea el cabeza de familia, o los 
jóvenes, etc. En esas condiciones generalmente está determinada la persona a 
la que ha de entrevistarse. En algunas encuestas de actitudes mediante 
entrevistas a la población adulta es necesario seleccionar un sólo adulto por 
vivienda. El entrevistador necesita un método claro, sencillo y rígido que le 
permita determinar la persona que proporcionará la información. Este es el 
método Kish. 

1. A cada vivienda se le asigna una hoja de cobertura que contiene el 
domicilio de la vivienda y un procedimiento para ordenar los habitantes 
del hogar. 

2. A cada adulto se le asigna un número de orden: en primer lugar los 
varones en orden decreciente de edad, continuando con las mujeres en el 
mismo orden decreciente de edad. 

3. Las hojas de cobertura contienen ocho tipos de tablas. Si se dispone de 
la dirección de la vivienda, se asigna a ésta una tabla. Si no se conoce de 
antemano, como en el muestren por rutas, se agrupan hojas de cobertura 
y se dan instrucciones al entrevistador para seguir el orden 
estrictamente definido. La hoja de cobertura incluye un cuadro como el 
siguiente: 


Si el número de adultos de la 
vivienda es 

Entrevístese al adulto número 

1 

1 

2 

2 

3 

2 

4 

3 

5 ó más 

4 



Si en una vivienda no está la persona elegida o se niega a responder, la hoja 
de eobertura deberá ser devuelta a la ofieina para su eomprobaeión. Alli se 
eomprueba la utilizaeión eorreeta de las hojas. 

7.8. OTRAS CLASES DE MUESTREO 

7.8.1. Muestreo por cuotas 

El muestreo estratifieado entraña muehas difieultades en la práetiea, pues 
neeesita gran eantidad de informaeión previa, y en investigaeión eomereial es 
difieil disponer de una lista de individuos que permita obtenerlos al azar. 

El muestreo por euotas tiene unas fases en eomún eon el muestreo 
estratifieado: 

• Identifiea grupos que eumplen determinadas eondieiones, por ejemplo de 
edad, sexo, hábitat, ete. 

• Se determina el tamaño muestral en eada grupo. 

Es en la siguiente fase donde se difereneia del estratifieado, en el momento 
de seleeeionar las personas. En el estratifieado se seleeeionan aleatoriamente, 
mientras que en el muestreo por euotas los elementos no se seleeeionan al 
azar, sino que se deja al entrevistador libertad para que elija las unidades. 

Es deeir, el entrevistador reeibe instrueeiones sobre el número de individuos 

r 

que debe entrevistar de eada earaeteristiea o earaeteristieas. Estas se 
denominan “euotas”. Generalmente las euotas eonsisten en el eruee de varias 
earaeteristieas, por ejemplo: 


1. Sexo 

2 eategorias: hombre-mujer 

2. Nivel de estudios 

3 eategorias: primarios, medios, superiores 

3. Grupo de edad 

4 eategorias: menor 18 años, 18-30 años, 31-50 años, 
mayor de 50 años. 









Esto da2x3x4x3=72 grupos, sobre los que se necesita información. 


No es difícil asignar un tamaño muestral a cada grupo, teniendo en cuenta la 
información existente a partir de los censos de población, considerando cada 
caracteristica como un criterio de estratificación. Se suele hacer en proporción 
al tamaño del grupo. Lo difícil es obtener una lista de los elementos de cada 
grupo, de ahi que se permita al entrevistador elegirlos. La idea del 
procedimiento es que si la muestra representa correctamente las caracteristicas 
de la población con las que está más relacionada, también representará a la 
población. Cada entrevistado dispone de una hoja de cuotas. Las cuotas pueden 
ser marginales o cruzadas. En las cuotas marginales se considera cada cuota 
independiente de las otras y se determina un tamaño muestral para cada cuota 
y modalidad, generalmente en proporción a la población. 

* Cuota cruzada 

Por ejemplo, supongamos que se deben realizar 25 entrevistas a personas 
mayores de 18 años para realizar un estudio de intención de voto. La hoja de 
cuotas marginales puede ser como la siguiente: 

Encuestador: . 

Debe realizar 25 entrevistas a personas mayores de 18 años. 

Kimage 

En la primera columna se define la cuota y sus modalidades. Hay tres 
cuotas: sexo, edad y nivel de estudios; con 2, 4 y 3 modalidades 
respectivamente. 

La segunda columna indica el número de entrevistas que debe realizar en 
cada modalidad, asi necesita 13 hombres y 12 mujeres. Cada vez que realiza 
una entrevista el encuestador anotará las modalidades correspondientes en la 
tercera columna. 

La cuota cruzada consiste en exigir un número directo al encuestador que 
combine simultáneamente los tres criterios, por ejemplo en una muestra de 
190 personas. 






C¡image 

El método de cuotas marginales es más empleado en la práctica, ya que es 
más fácil de aplicar, y el encuestador obtiene rápidamente las primeras 
entrevistas que corresponden fácilmente a las cuotas, mientras que con cuotas 
cruzadas es más difícil actuar. Otra razón práctica es que no se suele disponer 
de información sobre las distribuciones cruzadas para calcular 
proporcionalmente el número de encuestas en cada cruce, y si es fácil obtener 
las distribuciones marginales. 

Para evitar los sesgos que puede introducir el entrevistador al elegir a las 
personas que le sean más accesibles, se le suelen imponer condiciones 
adicionales, como que elija sus entrevistados dentro de unas rutas, etc. 

El método de cuotas se emplea frecuentemente en la práctica, ya que para la 
mayor parte de las encuestas no se dispone de un marco. Es posible que no sea 
tan válido como el muestreo aleatorio, pero si se elabora con cuidado puede 
proporcionar buenos resultados. 

7.8.2. Muestreo por conglomerados 

Cuando la selección individual de elementos que componen la muestra es 
muy costosa, se facilita el problema seleccionando aleatoriamente 
conglomerados. Es decir, la unidad de muestreo es un grupo que contiene 
varios elementos, y se denomina conglomerado. En consecuencia, la población 
ha de estar dividida en grupos sin solapamiento para elegir una muestra de 
éstos y estudiar todos sus componentes. Por ejemplo, para elegir una muestra 
de estudiantes de un colegio se pueden elegir aleatoriamente clases y 
entrevistar a todos los alumnos de éstas. El muestreo por conglomerados 
facilita el problema de localizar a las unidades poblaciones al concentrarlas 
geográficamente. 

Es frecuente que los conglomerados estén definidos como áreas o zonas de 
terreno bien delimitados, de modo que todas las unidades últimas de esta zona 
pertenezcan al conglomerado. Este tipo de muestreo se denomina también 
muestreo por áreas. Por ejemplo, se suelen utilizar como conglomerados las 
manzanas de casas en una ciudad. 


El criterio que se debe seguir para formar los grupos es que éstos sean tan 
heterogéneos eon relaeión a las variables de interés como la población general. 
Si los grupos son tan heterogéneos como la población, es tan efieiente como el 
muestreo aleatorio simple. Pero eon freeuencia los eonglomerados no suelen 
ser tan heterogéneos, eon lo que el error aumenta. 


7.8.3. Muestreo políetápíco 

Es una forma de muestreo menos eficiente que el muestreo aleatorio simple, 
pero faeilita la eleeeión de los elementos de la muestra aleatoria, 
especialmente cuando no se dispone de una lista de las unidades de la 
poblaeión. 

En este muestreo se proeede por etapas. En eada una, salvo en la última, la 
unidad de muestreo no eoincide eon la unidad que proporeiona la informaeión. 
Es deeir, se definen unas unidades primarias, por ejemplo, eiudades, y entre 
ellas se seleceiona una muestra. A continuaeión se definen las unidades 
secundarias, de menor entidad; por ejemplo, manzanas de las eiudades 
elegidas. Asi se obtiene una muestra aleatoria entre ellas. 

En la tereera etapa se definen eomo unidades; por ejemplo, las familias de 
esas manzanas, y se seleecionan una muestra de familias. 

Este muestreo tiene la ventaja de que no es neeesario eonfeeeionar la lista 
de todas las familias del pais, sino únieamente las de las ciudades, en primer 
lugar; la de las manzanas sólo en las eiudades elegidas y, por último, las 
viviendas de las manzanas que forman parte de la muestra. Además, tiene la 
ventaja de coneentrar geográficamente las eneuestas. 

El principal inconveniente es que inerementa los errores, pues en cada etapa 
se obtiene una muestra con su correspondiente error. Una muestra con dos 
etapas está sujeta a dos errores muéstrales, y una muestra de eineo etapas 
tendría eineo errores muéstrales. 


Otra euestión que se plantea es eómo repartir el tamaño de la muestra en las 
etapas. Por ejemplo, para una muestra de 1.000 familias se podrían elegir. 



entre otras posibilidades, 100 eiudades eon 10 entrevistas en eada una, o bien 
10 eiudades eon 100 entrevistas en eada una. 


La respuesta depende de la heterogeneidad del fenómeno. Si las eiudades 
son muy diferentes unas de otras, pero muy homogéneas en su interior, se 
seleeeionarán muehas, pero si éstas se eonsideran bastante semejantes entre si, 
pero eon eomportamientos más heterogéneos en los elementos de la eiudad, se 
seleeeionarán poeas eiudades y se estudiarán más ampliamente. 


7.8.4. Muéstreos combinados 


Hemos visto varios proeedimientos de muestreo, eada uno eon sus ventajas 
e ineonvenientes, eomo se muestra a eontinuaeión: 


Cuadro 7.11. Ventajas e inconvenientes de aigunos tipos de 

muestreo 


Método 

Ventajas 

Ineonvenientes 

Estratificado 

Reduce ei error 

Necesita mucha 
información Difícil diseño 

Por etapas 

Faciiidad de diseño 

Incremento del error 

Por áreas 

Concentra 

geográficamente 

Facilita el diseño 

Incremento del error 


En la práetiea de la investigaeión eomereial no es freeuente disponer de 
listas de los elementos de la poblaeión, espeeialmente euando se trata de 
eoleetivos muy numerosos. Sin embargo, es relativamente fáeil disponer de 
fieheros para algún nivel de agrupaeión, por ejemplo lista de munieipios, 
eenso en eada uno, ete., lo que permite diseñar un muestreo por etapas. Los 
errores asoeiados a este tipo de muestreo haeen que en la práetiea se eombinen 
varios proeedimientos, de manera que al eomplementarse se eompensen los 
inerementos de errores de unos eon las redueeiones que oeasionen los otros. 

Un proeedimiento habitual en España para elegir familias en eneuestas de 
opinión es el siguiente: 

















1. Se clasifica la población española en áreas y estratos. Es decir, se 
consideran seis áreas (regiones) y dentro de cada una estratos según el 
tamaño de la comunidad, rural y urbano, obteniéndose asi doce estratos. 

2. Se distribuye el tamaño muestral entre estos doce estratos. La 

distribución puede hacerse con distintos criterios de afijación, 
dependiendo del objetivo del estudio. Es frecuente asignar menor 
representación a las zonas rurales. 

3. Dentro de cada estrato se confecciona una lista con las unidades de 
muestreo: poblaciones. Se selecciona un número suficiente de éstas. La 
selección de las poblaciones se puede hacer con probabilidad igual o 
diferente. Generalmente en encuestas a adultos con probabilidad 
proporcional al número de habitantes para que, en última instancia, todos 
los adultos tengan la misma probabilidad de ser elegidos. 

El tamaño muestral de cada estrato se reparte entre las poblaciones 
resultantes del muestreo: 

1. Si se dispone de un fichero con los individuos de esas poblaciones, se 
pueden elegir directamente por algún procedimiento aleatorio. 

2. En el caso de que no exista un fichero, se puede recurrir a una nueva etapa 
siguiendo los criterios anteriores (seleccionar barrios o manzanas, etc.). 

3. De la misma forma, se puede proceder para elegir establecimientos 
comerciales, cafeterías, talleres de coches, etc. 

En estos casos el cálculo de los errores a través de las fórmulas es casi 
imposible. En la práctica, los resultados que se obtienen en la etapa final se 
suelen tratar como si procedieran de un muestreo aleatorio simple sobre la 
población completa. 


7.9. EJEMPLOS DE MUESTREO 


Unos ejemplos aclararán estas exposiciones. 



Caso 1. 


Supongamos que se quiere estimar la edad media de los asistentes a un 
curso de postgrado. La población está compuesta por 60 matriculados en los 
que se incluyen personas en paro y personas ocupadas. Se cree que las 
personas en paro son, en general, recién licenciados que buscan su primer 
empleo, mientras que los ocupados son personas con experiencia que tratan de 
conocer los últimos avances. En consecuencia, es posible que los niveles de 
edad sean diferentes en cada grupo, por lo cual vamos a tomar dos estratos: 

7^^ estrato: compuesto por los licenciados en paro, veinte personas 
numeradas del 1 al 20. 

2° estrato: compuesto por 40 personas en situación de ocupadas, numeradas 
del 21 al 60. 


Para obtener una muestra estratificada de tamaño n ^ 6 de forma 
proporcional, asignamos ni= 2 al estrato y n 2 ^ 4, el 2° estrato, obteniendo 
los siguientes resultados: 

estrato: 

Nj^20; n^^ 2. 


Obtenidos dos números aleatorios entre el 1 y el 20, resultaron el 4 y el 16, 
que corresponden a dos personas con edades de 23 y 24 años. La media, varian 
- za y cuasivarianza muéstrales toman los valores ^ 23,5, varj ^ 0,25. 


S] = cuasivarianza 


-li-var, = -^0,25 = 0,5. 
n-¡ ' I 


2estrato: 

^2^ 40; n2^ 4. 


Se obtienen números aleatorios entre el 21 y el 60, resultando 26, 31, 34, 48, 
cuyas edades respectivas son 36, 40, 35, 31. 

En esta segunda muestra, la media, varianza y cuasivarianza toman los 
valores: ^ image 2 = 35,5, var 2 ^ 10,25, S ^2 ^ 13,66. 






Estimación de los parámetros poblaeionales: 

La estimaeión de la edad media de los asistentes al eurso será: 

t^image 

Cálenlo del error de muestreo: 

Para obtener el error de muestreo, se neeesita ealeular la varianza del 
estimador: 

tuSmage 

y se estima en 

t^image 


El error de muestreo estimado es: 


Kimage 

La estimaeión por intervalo es, en eonseeueneia: 

31,5±k‘ 1,179 


eon una eonfianza de 95,5%, el valor de k es 2, y el intervalo eonereto: (31,5 ± 
2‘ 1,179) = (29,14; 33,86). 

Consideremos, ahora, que en lugar de ser una muestra estratifieada, es una 
m.a.s. de tamaño n = 6 que ha proporeionado los mismos individuos. Se 
eomprueba que la media estimada es la misma ^ image ^31,5, pero el error 
es mayor: 


vár = 38,91 
(6/5) 38,91 =46,69. 

La varianza del estimador es 


t^image 



y se estima en 



de donde se sigue que el error de muestreo estimado es V7. 

La estimaeión es mueho menos preeisa. Con una eonfianza del 95,5% el 
intervalo será: 



Caso 2. 


Este ejemplo muestra eómo la forma de afíjaeión puede variar el error eon 
un mismo tamaño muestral. 

Supongamos que tenemos definidos dos estratos de tamaños Ni= 2000, N 2 = 


8000. 


Sus euasivarianzas respeetivas son = 100 y S 2 ^ ^ 900. 

Se quiere tomar una muestra de tamaño n = 200. Determinar el tamaño de la 
muestra en eada estrato y el error de muestreo para la estimaeión de la media, 
utilizando los tres tipos de afíjaeión: 

a) Afij ación simple 



var X = 


I 


h 



y se estima en: 



y el error estándar 2,39. 






b) Afij ación proporcional 


Kimage 

la var (x) se estima en este caso como: 

Kimage 


y el error estándar 1,9. 

c) Afijación óptima 

Kimage 

La var x se estima 

Kimage 

y el error estándar 1,8. 

Con un mismo tamaño muestral, con distintas afíjaciones se ha podido 
reducir el error estándar de 2,39 a 1,8. Las ventajas de la afijación óptima son 
mayores cuando hay mucha diferencia entre las varianzas de los estratos. En el 
caso en que éstas fueran iguales, se obtendría el mismo resultado que en la 
afijación proporcional. Este ejemplo puede dar idea de la importancia que 
tiene la afijación y, en general, la selección de la muestra. 

En la práctica, dada la dificultad de realizar estas afijaciones exactamente, 
se utilizan otros tipos de afijaciones como: 

- Proporcional al tamaño del estrato. 

- Proporcional a la desviación tiplea de la variable en el estrato. 

- Inversamente proporcional a la raíz cuadrada de coste mínimo de 
ejecución de la encuesta en el estrato. 

Caso 3. 


Un fabricante de productos de ferretería quiso obtener la información de sus 
clientes directos sobre un nuevo sistema de suministro, que entregarla el 



pedido en un plazo de 24 horas, pero que resultaba ligeramente más caro que 
el tradicional. Para ello confeccionó una lista de tiendas con licencia para 
productos de ferreteria y se encontró con un número muy elevado: 4.500 
comercios. 

El procedimiento completo seguido para obtener la información fue el 
siguiente. En primer lugar, eligió un procedimiento de muestreo, ya que la 
población era demasiado grande para estudiarla completa y no se necesitaba 
tanta precisión. Para seleccionar el tipo de muestreo se examinó la 
información existente. Asi se observó que se podrian considerar dos grupos de 
tiendas, las pequeñas con poco volumen de ventas, en número de 4.000 y las 
grandes, que sumaban 500, representando éstas un volumen de ventas del 40%. 

Si se tomara una m.a.s. es posible que aparecieran muy pocas tiendas 
grandes cuando su importancia en el volumen de ventas es muy grande. En 
consecuencia, se decidió tomar una muestra estratificada. Dado que el 
producto se distribuía directamente a los establecimientos por personal de la 
empresa, se decidió aprovechar estas visitas para realizar la encuesta, que fue 
personal. No interesaba realizar un muestreo bietápico porque periódicamente 
se visitaba a todos los clientes. 

En consecuencia, el muestreo fue estratificado. La población se dividió en 
dos estratos. El de clientes menores de tamaño ^ 4000 y el de clientes 

mayores con N 2 ^ 500. 

En la encuesta se hicieron varias preguntas. Algunas de ellas recogieron la 
actitud positiva o negativa ante algunos cambios, y de ahi que se considerara 
una proporción como variable fundamental para elegir el tamaño muestral. 

La afijación fue proporcional al volumen de ventas, no al número de 
establecimientos; asi Wj ^ 0,6 y W 2 ^ 0,4. 

Se fijaron como objetivos un error máximo del 5% con una confianza del 
95,5%. Se supuso un total desconocimiento de las proporciones en los estratos 
luego Pjj ^ Qjj ^ 1/2. En consecuencia, aplicando la fórmula del tamaño 
muestral del apartado 7.6, se obtiene: 


Kimage 


La afíj ación proporcionalmente al volumen de ventas proporeiona 


ni= 495 *0,6 = 297 


n2- 495 *0,4 = 198 


Del listado de estableeimientos pequeños se extrajeron mediante números 
aleatorios 297 estableeimientos y por el mismo proeedimiento 198 del de 
grandes establecimientos. Tras haber pasado la encuesta, se obtuvieron los 
siguientes datos: en el primer estrato 180 estableeimientos eonsideran positivo 
el sistema; en el segundo estrato, 80. Las estimaciones de la proporción de 
establecimiento a favor dentro de cada estrato son: 

Pi = 180/297 = 0,606 ; 60,6% 61%. 

P 2 - 80/198 = 0,4040 ; 40,4% 40%. 

La proporeión de establecimientos a favor son: 

Klimage 

Parece que en el estrato de tiendas pequeñas existirá mayor interés por el 
sistema que en el de grandes. 

Para decidir si esta difereneia aparente era real, se realizó un eontraste de 
difereneia de proporciones. Véase el apartado 11.6.2.2. 

Las estimaeiones en eada estrato tienen un nivel de error superior al de la 
población. En efecto: 


t^image 

El error en el estrato 1 eon la eonfianza indieada es 

Kimage 


y en el estrato 2, 02 ^ 0,054 = 5,4%. 

Mientras que en la estimación de la población el error no supera el 5% que 
pusimos eomo objetivo. En concreto. 


Kimage 


y el error eon la eonfianza indieada es: 

t^image 

Caso 4. 


Se va a realizar una eneuesta eon el propósito de medir la inteneión de 
respuesta en un posible referéndum sobre un tratado internaeional. De aqui que 
se eonsidere eomo variable prineipal la proporeión de personas a favor del 
tratado. 

- La poblaeión objeto del estudio estará formada por los españoles de 18 o 
más años. 

- El ámbito será la península e islas Baleares y Canarias. 

- Dadas las earaeteristieas de la eneuesta, se eree eonveniente la entrevista 
personal en el domieilio del eneuestado eon posterior seguimiento 
telefónieo de los indeeisos. 

- Dadas las earaeteristieas de la poblaeión, la neeesidad de aeudir al 
domieilio para realizar la entrevista eon urna simulada debido a la 
naturaleza del tema y a la neeesidad de obtener resultados en un tiempo 
relativamente eorto, se seleeeiona un muestren polietápieo. En primer 
lugar se seleeeionan eiudades, en segundo lugar viviendas, y en tereer 
lugar la persona de la vivienda. 

Este proeedimiento se eombinará eon un muestren estratifieado por regiones 
y hábitat. Las eiudades se elegirán de forma aleatoria non probabilidad 
proporeional al eenso de poblaeión, eon el objeto de que una persona que vive 
en una eiudad grande tenga la misma probabilidad de ser elegida que una que 
vive en una pequeña. 

Se seleeeionan 120 eiudades mediante un proeedimiento sistemátieo. Este 
número se ha utilizado non freeueneia y proporeiona buenos resultados. La 
seleeción de las viviendas se hará mediante rutas aleatorias, y se utilizará el 
método Kish para la del entrevistado. Se proeede de la siguiente forma: 



En primer lugar, se calcula el tamaño de muestra necesario para lograr una 
estimación del porcentaje de personas a favor con un error de ± 3% y una 
confianza de 95,5% (k ^ 2). 

Para obtener el tamaño de la muestra se considera la fórmula del m.a.s., 
pues el muestreo estratificado reduce el error, mientras que el polietápico lo 
incrementa. Se cree que el error resultante será semejante al del m.a.s. y el 
cálculo de error en él es extremadamente complicado. 

Dado que la población española es muy grande, se considera la fórmula de 
poblaciones infinitas: 
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y se toma P ^ Q ^ 1/2 porque se desconoce el porcentaje de intención. Esta es 
la actitud más conservadora, la que proporciona mayor tamaño muestral: 
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Si en lugar de un error de 3% se deseara 2%, se necesitarla una muestra de n 
= 2 • 500. Este incremento de coste y esfuerzos no es justificable para una 
reducción de error tan pequeña, por lo tanto se toma n ^ 1.112 

Este tamaño muestral se distribuye entre las seis zonas geográficas en 
proporción a su número de habitantes utilizando el censo de población. Dentro 
de cada región la muestra se estratifica por tipo de hábitat y se distribuye el 
tamaño muestral en proporción a su población. 

Si la población total es de 40 millones y la de la zona centro es de 8 
millones, le corresponde un tamaño muestral 
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dentro de esta región se consideran dos estratos, el urbano de tamaño 6 
millones, y el rural de 2 millones. Los tamaños muéstrales respectivos son: 
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Dentro de esta región se deeide elegir 10 eiudades en la zona urbana y 15 
poblaeiones de la zona rural eon probabilidades proporeionales a la poblaeión. 
El proeedimiento es sistemátieo eon probabilidades proporeionales a la 
poblaeión, de la siguiente forma: 

Se ealeula la poblaeión total de todas las eiudades de la zona metropolitana. 
Este total se divide entre el tamaño de la muestra n ^ 10. Es deeir, 
6.000.000/10 ^ 600.000. Todas los núeleos eon poblaeión igual o superior a 
600.000 están ineluidos en la muestra. 

Para los núeleos no ineluidos, los de poblaeión inferior a 600.000 
habitantes, se eonfeeeiona una lista eon sus poblaeiones y su poblaeión 
aeumulada. Sobre ésta se realiza una seleeeión sistemátiea, obteniendo un 
número aleatorio entre el 1 y el 600.000 y se seleeeionan las poblaeiones a 
intervalos de 600.000. Veamos un ejemplo simplifieado eon 10 eiudades de las 
que se desea tomar una muestra de 5: 


Ciudades 

Población en miles 

A 

3.000 

B 

300 

C 

1.100 

D 

600 

E 

1.000 

F 

200 

G 

1.400 

H 

600 

1 

500 

J 

300 


9.000 


El intervalo de muestreo seria N/n ^ 9/5 ^1.8 millones. Todas las eiudades 
de 1.8 millones entrarían a formar parte de la muestra. Asi, la eiudad A 
perteneee ya a la muestra. Se elimina de la lista y mantienen las 9 restantes, 
aeumulando su poblaeión. 




Ciudades 

Población en miles 

Población acumulada 

B 

300 

300 

C 

1.100 

1.400 

D 

600 

2.000 

E 

1.000 

3.000 

F 

200 

3.200 

G 

1.400 

4.600 

H 

600 

5.200 

1 

500 

5.700 

J 

300 

6.000 


Se selecciona un número al azar entre 1 y 1.800.000, por ejemplo el 
425.304, el intervalo de muestreo será 1,8 millones. Luego se seleccionan las 
ciudades C (contiene el 425.304), E (contiene el 2.225.304), G (contiene el 
4.025.304) y J (contiene el 5.825.304). 

El tamaño muestral 167 (zona centro metropolitana) se divide entre las 10 
ciudades proporcionalmente a sus poblaciones. Dentro de cada ciudad es 

r 

necesario elegir los hogares. Estos se seleccionan mediante rutas aleatorias 
partiendo de unos puntos de arranque aleatorios. Dentro del hogar se 
selecciona la persona a entrevistar mediante el método Kish. 

Para recoger la información, como es un tema politice, se utiliza la urna 
simulada. El encuestado deposita su cuestionario personalmente en una urna. 
De esta forma es anónimo. Este procedimiento mejora la tasa de respuesta y la 
veracidad en los temas que afectan a la intimidad. Para los indecisos se 
desarrollará un control telefónico una semana más tarde. Esto permitirá 
observar la evaluación del voto dentro de los indecisos. 

En la encuesta no sólo se recogerá la actitud hacia el tratado, sino también 
cuál fue su voto en las elecciones legislativas anteriores y cuál seria en unas 
nuevas elecciones. Esto permitirá corregir los sesgos que se producen debido a 
la sobrerrepresentación sistemática de algunas partidos y subrepresentación de 
otras. Las respuestas se contrastarán con los datos existentes sobre los 
porcentajes de votantes a cada partido, y los estudios de evolución de voto que 
realiza permanentemente la empresa de investigación comercial. Esto 











permitirá equilibrar la muestra según la estructura real del universo 
considerado. 

Para calcular la proporción de personas a favor se utiliza la fórmula de la 
proporción ponderada. Como error se asigna el 3% inicial, ya que se supone 
que el muestreo estratificado lo ha reducido y el polietápico lo ha 
incrementado, de manera que en conjunto se piensa que no va superar el 3%. 
Este error será superior en las estimaciones que se puedan hacer por estratos; 
por ejemplo, la proporción obtenida en la zona centro tendrá un error 
posiblemente superior. 

Caso 5. 


Se desea diseñar un plan de muestreo para estudiar las actitudes de la 
población vasca hacia distintos tipos de promociones y sus comportamientos a 
la hora de adquirir un producto. El estudio debe proporcionar información no 
sólo para el Pais Vasco sino también para cada una de las provincias. Dada la 
complejidad de la encuesta, que recoge muchas preguntas, se decide realizarla 
mediante encuesta personal en el domicilio del encuestado. Se considera como 
universo todas las personas mayores de 16 años residentes en la Comunidad 
Autónoma (Vizcaya, Álava y Guipúzcoa). 

Se cree que las actitudes y comportamientos pueden variar según la edad, el 
sexo y el tamaño del municipio. De ahi que se recoja información secundaria, 
como la población del Pais Vasco. 


Kimage 

Se fijan unos objetivos de error para la encuesta considerando que la 
variable principal sea la estimación de un porcentaje con P ^ Q ^ 1/2. 
Confianza 95,5% (k ^ 2) y error máximo para la estimación del Pais Vasco 2% 
y error máximo en cada provincia 4,5%: 

Kimage 

Este tamaño muestral se reparte entre las tres provincias, pero de manera 
que en ninguna se supere el error de 4,5%. 

De forma proporcional a Álava le corresponde un tamaño muestral 
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Esto daría un error en la estimación de Álava del siguiente orden: 

t^image 

El error es superior al deseado, por lo que elegiremos un tamaño muestra! 
en Álava que proporcione un error máximo de 4,5%: 
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El resto de la muestra (2.497 - 494 ^ 2.003) se distribuye en proporción a la 
población. La población mayor de 15 años de ambas provincias es 1.509.300: 
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Estos tamaños muéstrales proporcionan unos errores máximos provinciales: 
Vizcaya 

t^image 


Guipúzcoa e = 3,6% 

Estos tamaños muéstrales se reparten en cada provincia por igual entre 
hombres y mujeres y por edades en proporción a la población existente en cada 
grupo. No se considerará la estratificación según el tipo de hábitat para hacer 
el ejemplo más sencillo y comprensible; de esta forma se obtendrán las 
siguiente cuotas: 


Kimage 

Estas serán las cuotas que deben obtener los encuestadores. 

El diseño incluirá la selección aleatoria de unos municipios y barrios. La 
selección de hogares se hará mediante el procedimiento de rutas aleatorias 
partiendo de unos puntos de arranque elegidos aleatoriamente dentro de los 
barrios. Para la elección de la persona se seguirá el método Kish. 



Caso 6. 


Se quiere realizar una encuesta para estudiar los hábitos y actitudes de los 
jóvenes de una ciudad en relación al alcohol y el tabaco. Para ello es necesario 
diseñar el procedimiento de muestreo. La encuesta recoge distintas preguntas 
sobre el tema, entre las que se encuentran la referencia a si son o no 
fumadores. Esta pregunta se considera esencial cara a la obtención del tamaño 
de la muestra. Concretamente, se desea obtener un n que proporcione una 
estimación de la proporción de jóvenes fumadores con error máximo del 3% y 
una confianza de 95,5%. 

No se dispone de un marco exacto de todos los jóvenes de la ciudad, pero 
teniendo en cuenta que la escolarización es obligatoria, un marco bastante 
aproximado será la lista de matriculados en los tres centros de enseñanza de la 
ciudad, un instituto y un centro de formación profesional y un colegio privado. 

Luego se realiza la investigación en estos centros. No se acude al censo para 
elegir la muestra porque el coste de localizar físicamente a los componentes, 
bien en el domicilio o por teléfono, es alto, y por correo puede haber una alta 
tasa de no respuesta. En consecuencia el estudio se puede hacer en los centros 
de enseñanza, con la idea de que la población no escolarizada es escasa y el 
sesgo que se puede producir por este lado es inapreciable. 

En los cursos correspondientes a las edades de 12-16 años, los alumnos 
matriculados en los centros son respectivamente N^ = 2.000, N 2 = 1.500, N 3 = 
2.500, luego N - 6.000. 

En el muestreo aleatorio simple el tamaño muestra! necesario para lograr 
los objetivos de error fijadas, e ^ 3%, k ^ 2, será: 
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donde P ^ Q ^ 50%, valores que determinan el mayor n; este tamaño muestral 
se reparte entre los distintos centros proporcionalmente al tamaño de cada 
uno: 

Instituto: 


t^image 





Colegio privado: 
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Formación profesional: 


Kimage 

No se realizan todas las encuestas en un solo centro porque podría estar 
sesgada si alguno sigue una política educativa más intensa en este campo y sus 
alumnos se mueven en ambientes diferentes. Estratificamos por tipo de centro. 

Una de las hipótesis de partida es que puede haber diferencias por sexo y 
por nivel de edad. De ahi que sea conveniente estratificar según estas dos 
características en cada centro, con lo que se obtienen 10 estratos. 
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El tamaño muestral correspondiente a cada centro se reparte con afij ación 
igual en cada estrato. La tabla representa los tamaños muéstrales de cada 
estrato en el instituto. Para elegir los integrantes de la muestra se deberían 
confeccionar las listas de cada estrato en cada centro, elegir aleatoriamente y 
localizar a los estudiantes elegidos. Ahora bien, como casi todos los 
estudiantes de un curso son de la misma edad y hay tantas chicas como chicos, 
creemos que no va a haber sesgo si, en lugar de seleccionarlos de forma 
aleatoria, se seleccionan dos clases de cada curso (35 matriculados en cada 
grupo) y se encuesta a todos los asistentes ese dia (téngase en cuenta que la 
asistencia es obligatoria). De esta forma se obtendrá aproximadamente el 
mismo número de chicas y de chicos, por edades. 

Esto permitirá obtener estimaciones de la proporción de fumadores en cada 
grupo de edad y sexo. Ahora bien, el error del 3% señalado es únicamente para 
la estimación de la proporción poblacional. La estimación en cada estrato 
tendrá mayor error. El cálculo del error se ha hecho para el m.a.s. y sin 
embargo el diseño ha combinado varios métodos estratificados, cuotas, etc. 

Unos rebajan el error (estratificado), otros lo incrementan (etapas), en 
conjunto pensamos que se compensan y es lo mismo que en el m.a.s. 



Caso 7. 


Para estimar el gasto mensual medio por familia en produetos deportivos en 
una poblaeión de 50.000 familias, se ha tomado una muestra de 100, 
obteniendo un gasto medio familiar de 10.000 pesetas. Si se supone que la 
cuasidesviación tiplea del consumo de la población es de 3.000 pesetas, se 
pide: 


a. Obtener una estimación del gato medio con una confianza del 95,5% (k 

-2). 

b. El error de la estimación. 

c. Si el tamaño de la muestra es de 1.000 familias, con los mismos 
resultados muéstrales, ¿cuál será el nuevo error de estimación? ¿Y si el 
tamaño de la muestra es de 2.000? 


El gasto medio se estima como la media muestral más menos el error: 

e2 - 4 [(50.000-100)/50.000] (SOOO^/lOO) - 600^ 

Luego el gasto medio se estima en (10.000 ± 600) con una confianza 
del 95,5%. 

El error de estimación es 600 pesetas para la confianza dada. 

Si n ^ 1.000 el error se reduce a 188 pesetas. 


Ahora bien, si se duplica el tamaño muestral, n ^ 2.000, la reducción del 
error es pequeña; se reduce a 132 pesetas. El coste de una muestra de 2.000 
familias es muy superior a la de 1.000, mientras que el error se reduce en 56 
pesetas, y los errores ajenos al muestreo (no controlables) pueden ascender 
considerablemente al ser necesario emplear mas encuestadores y manejar un 
volumen importante de cuestionarios. 

Caso 8. 




En una Universidad se planteó la opeión de eambiar la feeha de exámenes 
de septiembre a junio. Para tomar una deeisión se estimó el poreentaje de 
alumnos que estaban a favor del eambio. 

El diseño de muestreo fue el siguiente. En primer lugar se fijó la poblaeión 
objeto de estudio, estudiantes matrieulados en la Universidad. Para obtener un 
“mareo” adeeuado se aeudió a las listas de estudiantes matrieulados en eada 
Faeultad. Ahora bien, los estudiantes que se eneuentran matrieulados en dos 
Faeultades, en un m.a.s. y eon este mareo, tendrían el doble de probabilidades 
de ser elegidos que los estudiantes que sólo eursan una earrera. Si este grupo 
tie-ne una opinión eomún diferente al resto, podría sesgar los resultados. 

Se eomprobó que el número de alumnos en esta situaeión era insignifieante 
y se obvió el problema eonsiderando eomo mareo el eonjunto de listados de 
alum-nos matrieulados en eada faeultad. 

A eontinuaeión se estableeieron unos objetivos a lograr en el estudio. Dada 
la importaneia del problema y que la eneuesta no suponía un gasto exeesivo, 
ya que era fáeil la loealizaeión de los estudiantes, se mareó un margen de error 
para la estimaeión del poreentaje de estudiantes a favor del 5% y una 
eonfianza del 95,5%. 

Ante la falta de informaeión previa sobre la opinión de los estudiantes, se 
eonsideró que eran bastante dispares y se deeidió tomar P ^ Q ^ 1/2. Asi el 
tamaño muestral resultante es 385. 

En la fase siguiente, 385 estudiantes elegidos aleatoriamente eontestaron a 
un euestionario. De ellos 160 estaban a favor del eambio de feehas; por lo 
tanto, se estimó que la proporeión a favor era 160/385 ^ 0, 415, es deeir 
41,5%, eon un error de más menos 5% y una eonfianza del 95,5%. Asi el 
intervalo de eonfianza para el poreentaje es (36,5%, 46,5%). 

Caso 9. 


Se ha introdueido una pregunta en una eneuesta ómnibus dirigida a 
empresas, obteniendo una muestra válida (de la poblaeión objeto de estudio) 
de n ^ 200, de las euales 60 manifestaron estar interesadas en un nuevo 
servieio de informaeión. 




Si el censo de empresas con características adecuadas para este tipo de 
servicio es de 3.000, se puede estimar la proporción de empresas interesadas 
con una confianza del 95,5%. Aplicando la fórmulas se obtiene la proporción 
de la empresa 60/200 ^ 0,30; el error e ^ 0,062 ó 6,2%; el intervalo de 
confianza para el porcentaje es (23,8, 36,2). 

Comentarios finales 

La teoría estadística ofrece un instrumento matemático completo para el 
muestreo. A través de unas fórmulas se puede obtener el tamaño muestral 
necesario para unos objetivos, o calcular el error de una estimación. Sin 
embargo, estos cálculos se complican mucho cuando se utilizan 
procedimientos complejos de muestreo y es casi imposible su cálculo. 

El modelo matemático es un patrón ideal que regula la actuación en la 
práctica. No quiere decir que se tenga que aplicar exactamente, lo cual puede 
ser imposible, y que el investigador tenga que renunciar a su propio criterio 
utilizando la fórmula que le parezca más apropiada, sino que es necesario 
actuar dentro de los condicionantes impuestos por la realidad de forma que 
podamos acercarnos todo lo posible al modelo matemático con el mínimo 
costo. 

Las principales dificultades que se encuentran en la práctica son: 

• Dificultad de localizar a las unidades muéstrales. Incluye las 
instrucciones para seleccionar la muestra y la selección material de la 
misma. 

• Se estudian varias características o parámetros. 

Se debe actuar manteniendo los principios del m.a.s. de que todos los 
sujetos tengan la misma probabilidad de ser elegidos. La decisión sobre el 
método de muestreo depende de la información disponible, del tipo de 
información que se pretende y del esfuerzo que se pueda hacer para 
conseguirla. Una pauta general de comportamiento es elegir el método con 
mejor relación coste/beneficio, que represente adecuadamente la población 
que se estudia y ofrezca suficiente confianza en los resultados como para 
tomar decisiones. 



En cuanto al problema del número de variables a estimar, los modelos están 
eonstruidos para la estimaeión de una sola variable y no para el estudio de sus 
interrelaeiones. Para determinar el tamaño de la muestra es neeesario elegir 
las variables más relevantes del estudio y determinar el tamaño para ellas. 
Para solueionar estos problemas existen otras solueiones: 

• Otros métodos de muestreo, eomo el muestreo por euotas. 

• En la práetiea se ealeulan los errores a través de su equivalente en el 
muestreo aleatorio simple en poblaeiones infinitas. 

• Se utilizan submuestras de una muestra para estimar las varianzas y 
ealeular los errores. 

Cuando se produeen subrepresentaeiones de algún eoleetivo en una muestra 
aleatoria, eomo por ejemplo, menor proporeión de hombres que los que 
existen en la poblaeión, que puede produeir un sesgo, es posible introdueir una 
ponderaeión atribuyendo un peso diferente a las respuestas de los hombres y 
de las mujeres. La ponderaeión se haee para equilibrar la muestra y que no se 
obtenga un sesgo por eneuestar al eoleetivo más fáeilmente aeeesible. 
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ANALISIS CLASICO DE LA 

INFORMACIÓN 


8.1. OBJETIVOS DEL CAPÍTULO 


Una vez concluido este capítulo, el lector habrá adquirido conocimientos 
sobre los siguientes aspectos: 

• Por qué es importante el análisis de datos. 

• Qué etapas deben seguirse para analizar los datos. 

• Cómo y cuándo se codifican los datos. 

• Cómo se analizan las variables individuales y qué instrumentos se 
pueden emplear. 

• Cómo se analizan las preguntas por subgrupos y qué herramientas 
estadísticas se pueden utilizar: tablas cruzadas, contrastes de hipótesis, 
test de diferencias de medias o proporciones, etc. 

• Cómo se miden las relaciones entre las variables métricas, ordinales, 
nominales, dicotómicas: coeficientes de correlación, contrastes 
chicuadrado, otras medidas de asociación. 

• Test no paramétricos de utilidad en Investigación Comercial. 


8.2. EL ANALISIS DE LA 
INFORMACIÓN. 





CONSIDERACIONES PREVIAS 


La información cuantitativa, frecuentemente proeedente de cuestionarios o 
de bases de datos, se analiza mediante métodos estadistieos que permiten 
transformar las cifras numéricas en algo comprensible, ilustrativo y útil para 
tomar deeisiones. Son varias las razones por las euales se deben estudiar los 
métodos de análisis de informaeión: 

• En primer lugar, porque permiten llegar a interpretaciones y 
conclusiones que no se pueden obtener con la simple observación de 
los datos. Hay que tener en cuenta que el mayor eoste eeonómico de una 
investigaeión suele ser la reeogida de datos, mientras que su explotación 
estadistica es mucho más barata. Seria una pena tener datos y no ser 
capaz de explotarlos. 

• El conocimiento de las técnicas permite aplicarlas e interpretar los 
resultados correetamente, evitando utilizaciones de herramientas 
estadisticas desafortunadas. Para cada tipo de datos de que se disponga 
habrá una técnica apropiada para su tratamiento. 

• Ayuda a comprender los informes o estudios realizados por otras 
personas y enjuieiar su validez. Los informes estadistieos no son, como 
se les achaca a veces, manipulables. Esto sólo ocurre para las personas 
que no conoeen las técnieas, su significado y sus limitaciones. Cuando se 
comprenden éstas, no hay ambigüedades, ni manipulaeiones posibles. 

• El conocimiento de las técnicas genera demanda de información, es 
decir, puede influir sobre los objetivos de un estudio al saber que es 
posible obtener determinadas informaciones. Si la persona que encarga el 
estudio eonoee los métodos, faeilita enormemente la tarea de diseño de 
la investigaeión, el entendimiento con el investigador, la calidad del 
proyecto e incluso la adecuación del presupuesto. 

La fase de análisis de los datos es fundamental, pues mal realizada, por no 
ser el método adecuado o no interpretarse correctamente, puede llegar a 
conelusiones erróneas, incompletas o falsas. Ahora bien, un buen análisis no 
salva un estudio mal diseñado, si los objetivos y los interrogantes no están 



bien concretados. Si el cuestionario no tiene un buen diseño, si el plan de 
muestreo no es adecuado, etc. el análisis se apoya sobre una base incorrecta y 
el estudio será estéril. Es primordial considerar el estudio como un todo y 
diseñar la muestra y el cuestionario en función del análisis que se quiere 
realizar. 


8.3. ETAPAS DEL ANÁLISIS DE LA 
INFORMACIÓN 


Generalmente, la información se recoge a través de cuestionarios o procede 
de bases de datos y el investigador se encuentra con un cúmulo de datos que es 
necesario depurar y simplificar para hacerlos comprensibles y convertirlos en 
un informe. Para ello se seguirán las siguientes etapas: 

1. Revisión de los cuestionarios. En esta fase se trata de identificar y 
corregir las posibles fuentes de error. Para ello se revisan los 
cuestionarios buscando ambigüedades, como respuestas no legibles o 
en las que no se sabe qué cuadro o casilla se ha marcado, omisiones, 
es decir, faltas de respuestas voluntarias o involuntarias, 
incoherencias, etc. 

2. Codificación, clasificación y recopilación de cuestionarios. La 

codificación consiste en asignar un número a cada una de las posibles 
respuestas. La codificación traduce la información proporcionada por 
el encuestado en lenguaje normal a un lenguaje estadístico e 
informático. Transforma cada pregunta en una o más variables y cada 
respuesta en un valor de la variable. 


• Los datos codificados se recopilan de forma sistemática en un 
fichero de ordenador o matriz de datos, por ejemplo en Excel, 
que permita el tratamiento estadístico posterior. 

• Cada fila del fichero recoge las respuestas o la información 
sobre un individuo. A cada pregunta o variable codificada se le 
asigna una columna del fichero. La intersección de la fila i con 



la columna j recogerá la respuesta, codificada, del individuo i a 
la pregunta asignada a la columna j. 


La primera columna se reserva para el identifieador del individuo. 


Identifieador 

Variable 1 

Variable 2 


Variable 9 
= edad 

1 

1 

2 


24 

110 

2 

1 


30 


La tabla reeoge las respuestas de los individuos a un cuestionario. Asi, la 
persona 1 ha elegido la modalidad 2 de respuesta a la primera pregunta y tiene 
24 años. La persona 110 tiene 30 años. 

3. Análisis de cada pregunta. Las preguntas al codificarse se han 
convertido en variables nominales, ordinales o métricas. El análisis 
propiamente dicho comienza eon el estudio de las respuestas a eada 
pregunta ahora convertida en variable. Se busea haeer resúmenes, 
descripeiones y estimaeiones de las respuestas de la poblaeión a eada 
pregunta. 

4. Análisis de las preguntas por subgrupos. Pueden apareeer grupos de 
población que sean de interés. Por ejemplo, grupos por edad, seetor 
productivo, sexo, zona de residencia, etc. Se estudian las respuestas a 
cada pregunta dentro de los diferentes grupos. Los resultados de los 
distintos grupos se comparan entre si estudiando si las respuestas son 
iguales o existen difereneias significativas. 

5. Estudio de las relaciones entre pares de preguntas. Ahora se 
estudian las relaeiones entre las preguntas, como por ejemplo la 
relación entre una aetitud y el nivel cultural, o entre una aetitud y el 
nivel de gasto,entre la edad y la condieión de ser eonsumidor o no 
consumidor, etc. Lo que se persigue es estudiar qué variables ineiden 
sobre los eomportamientos, las actitudes, opiniones, etc., cuándo se 
observan simultáneamente. Existen diferentes métodos estadistieos 








que permiten estudiar estas relaeiones teniendo en euenta la 
naturaleza de las variables eonsideradas. 


6 . Estudio de las relaciones entre todas preguntas. En esta etapa se 
estudian simultáneamente todas las variables a través de métodos de 
estadistiea multivariante. Existen métodos que expliean una o varias 
variables en funeión de las demás y métodos deseriptivos que 
estudian las relaeiones entre todas. Otros obtienen grupos de personas 
semejantes en su eomportamiento u opinión, y deseriben las 
earaeteristieas del grupo. 

7. Interpretación de los resultados, conclusiones y recomendaciones. 

Finalmente se presenta un informe que eontiene el objetivo de la 
investigaeión, la metodología seguida, los resultados y las 
eonelusiones o reeomendaeiones. 

8.4. LA CODIFICACIÓN 


Es una fase eseneial del estudio que eonsiste en traducir las respuestas a 
números. Es una fase muy delieada porque si la eodifieaeión no se haee bien 
se puede distorsionar todo el análisis de los datos. 

De eada pregunta naee una o más variables. Las esealas de medieión 
empleadas en los euestionarios pueden ser de distinta naturaleza: nominales, 
ordinales, métrieas de intervalo o métrieas eontinuas, de asoeiaeión, de Likert, 
ete. Las preguntas pueden ser abiertas o eerradas, dieotómieas, de respuesta 
múltiple, ete. 

• La eodifieaeión es seneilla en las preguntas de respuesta cerrada, por 
ejemplo: 


Es usted: Hombre □ Mujer □ 

Se puede emplear una variable nominal; por ejemplo, que tome el 
valor 1 euando sea un hombre y el 2 euando sea una mujer. 



• Se procede de igual forma si la variable está clasificada en categorías o 
modalidades, por ejemplo: 

Su edad es: menor de 25 □ 1 de 25 a 45 □ 2 1 más de 45 □ 3 
y se les asignará respectivamente el 1, 2 y 3. 

• Si es una escala métrica, el código coincide con el valor, por ejemplo: 

Su edad es.años 

Si la respuesta es 25 el código será 25. 

• Puede haber preguntas que contengan 2 variables, por ejemplo: 

Indique la importancia que tienen para usted las siguientes características 
de un coche: 


Característica 

Grado de importancia 

Influyó en la decisión 

Nada 

Poco 

Algo 

Bast. 

Muy imp. 

Si No 

1.° Estabilidad 

□ 

□ 

□ 


□ 

[ ] [ I 

2.’’ Linea elegante 

□ 

□ 

□ 

□ 

□ 

|] [| 

3.® Maletero espacioso 

n 

□ 

□ 


n 

[] [1 


De la pregunta estabilidad se obtienen dos variables. Una es el grado de 
importancia, y toma los valores 

1 ^ nada 2 ^ poco ... 5 ^ muy importante 

y otra su influencia sobre la decisión, con los valores 1 ^ si, 0 = no. 

• Las preguntas de respuesta múltiple se descomponen en varias variables. 
Por ejemplo: 

Antes de invertir sus ahorros se asesora a través de: 

Amigos □ 

Familiares □ 

Profesionales □ 

Otros □ 








Cada persona puede elegir más de una respuesta. En este easo se 
deseompone en 4 variables dieotómieas. La variable «se asesora a través de 
amigos» tiene 2 modalidades, 1 ^ si y 0 ^ no, y lo mismo oeurre eon 
familiares, profesionales y otros. Estos eódigos suelen apareeer en el propio 
euestionario, de manera que el entrevistador se limita a redondear la respuesta 
elegida. 

• Las preguntas de respuesta libre presentan mayor difieultad para el 
tratamiento informátieo, ya que se pueden obtener un gran número de 
respuestas diferentes. El proeedimiento que se sigue eonsiste en 
eonvertir la pregunta, a posteriori, en eerrada, examinando todas las 
respuestas y a partir de ellas diseñar las eategorias. Seguidamente se 
asigna eada respuesta libre a una de estas eategorias. 

El método presenta varias difieultades: la primera es elegir las eategorias o 
tipologia de respuestas de manera que no sea exeesivamente amplia pero 
reeoja bien las respuestas, sin pérdida de informaeión; la segunda difieultad 
estriba en asignar algunas respuestas a la eategoria o elase eorrespondiente, ya 
que una respuesta libre puede tener muehos matiees y es neeesario valorar la 
importaneia de eada uno. Aetualmente se están desarrollando métodos 
estadistieos multivariantes para el tratamiento de las respuestas libres. 

La frontera entre variables cualitativas y cuantitativas no siempre es 
elara. Por ejemplo, euando se utiliza una eseala de Likert o un difereneial 
semántieo, se puede eonsiderar eomo eategóriea o métriea. Asi, una eseala de 
Likert eon siete grados de aeuerdo es eategóriea, pero en algunos análisis se la 
puede eonsiderar euantitativa, eontinua en el intervalo [1,7] y ealeular, por 
ejemplo, una media, ya que ésta es interpretable. 

Es neeesario tener presente que euando una variable es métriea, eomo la 
edad en años, se puede eonvertir en ordinal y en nominal Ooven, adulto, 
mayor) pero no se puede trasformar en el sentido eontrario. Cuando una 
variable métriea se eonvierte en nominal se pierde informaeión, pero tiene 
grandes ventajas, eomo poder analizarse simultáneamente eon otras nominales 
y se reduee la influeneia de los valores extremos o raros. 


8.4.1. Cuándo se recodifícan los datos 



Tras un primer análisis, el deseo de un eonoeimiento más profundo y 
exhaustivo eonduee a mayores exigeneias de explotaeión de la informaeión. 
Para ello se pueden eruzar variables, dividir en elases una variable eontinua, 
ete. Los investigadores eon freeueneia reeodifiean los datos. Las situaeiones 
más freeuentes que aeonsejan aetuar asi son las siguientes: 

• Cuando se ha eometido un error en el cuestionario. Por ejemplo, se han 
impreso euestionarios eon el eódigo 0 para indiear que «se eonsume» y 1 
que «no se eonsume», euando deberla ser al revés. 

• Cuando el nuevo número de categorías pueda proporeionar un análisis e 
interpretaeión más rieo que en su forma original. 

• Cuando la información es continua e interesa agruparla en unas 
eategorias para eruzar variables; por ejemplo, la edad o la renta de las 
personas. 

• Cuando las categorías no recogen todas las posibilidades. Es decir, 
cuando una pregunta queda abierta y los que responden incluyen 
anotaciones. Entonces hay que abrir nuevas categorías que recojan las 
modalidades de la pregunta abierta. 

• Cuando una categoría tiene una elevado rango de observaciones 
conviene dividirla en varias para distribuir las respuestas; por ejemplo, 
la edad de los que responden los cuestionarios. 

• Cuando una o varias categorías tienen una proporción muy pequeña de 
observaciones, suele/n incluirse en otra/s clase/s y se procede a una 
recodificación de las preguntas. 

• Cuando se desea combinar dos preguntas, como por ejemplo renta y 
edad. Se podría llamar 1 a jóvenes con renta alta; 2 a jóvenes con renta 
media; 3 a adultos con renta baja, etc. 


8.4.2. Cómo se recodifican los datos 

La recodificación de los datos suele hacerse, generalmente, hacia un 
número menor de categorías. Se actúa así cuando el abanico de valores sea 
muy grande. Por ejemplo, las edades de las personas que responden a un 
cuestionario podrían estar comprendidas entre 9 y 98 años. Existen 90 



categorías, una por cada año, que se pueden resumir en unos pocos grupos o 
intervalos -niños, jóvenes, adultos, mayores- y después se presenta un 
histograma de frecuencias. 

En general, la reeodifieación de los valores debe tener en cuenta lo 
siguiente: 

1. Las eategorías tienen que estar cerradas. Esto significa que debe 
haber una categoría para eada individuo de la muestra. 

2. Las eategorías deben ser mutuamente excluyentes, sin solapamientos. 
Por ejemplo, 0-13 años es niño y se codifiea con uno; 14-29 años es 
joven y se puede codificar con un dos; 30-60 adulto y se codifiea eon 
tres; 61 y más es mayor y se eodifiea con un cuatro. Está claro que 
una persona sólo puede perteneeer a una categoría. 

3. Las eategorías deben ser significativas. Debe haber más variación 
entre categorías que dentro de ellas. Por ejemplo, los niños son muy 
homogéneos entre sí, pero muy distintos de los mayores. 

4. También hay que deeidir cuántas categorías se deben considerar. En 
principio, cuantas más categorías haya, menos observaciones tendrán. 
Inversamente, cuantas menos categorías haya, más observaciones 
tendrán. Se corre el peligro de encontrar asociaciones que realmente 
no se den. En general debe decirse que cuando una categoría tenga 
muy pocas frecuencias deberá fundirse con otra. 


8.5. ANÁLISIS INDIVIDUAL DE 
CADA PREGUNTA O VARIABLE 

Normalmente el cuestionario tendrá preguntas relativas al objetivo de 
estudio, como actitudes o comportamientos, opiniones y otras de 
caracterización como sexo, edad, renta, nivel de estudios, zona de residencia. 
Las primeras preguntas responden a los objetivos de la investigación y se 



analizan para conocer las respuestas del conjunto de la población, es decir, su 
actitud, comportamiento, opiniones, etc. 

El análisis de las variables de caracterización permite conocer la estructura 
de la muestra y si es representativa de la población. En caso negativo habrá 
que corregir la muestra o dar diferentes pesos a los grupos. Para conocer cada 
variable se utilizan los métodos clásicos descriptivos, estimaciones y 
contrastes de hipótesis. Para elegir el método adecuado debe tenerse en cuenta 
la naturaleza de la variable que ha surgido de la pregunta. Las posibilidades de 
tratamiento de la información aparecen en los siguientes apartados. 


8.5.1. Cálculo de las frecuencias absolutas, relativas y 
porcentajes 


Si las variables son cualitativas el cómputo se hace por modalidades. Si las 
variables fueran métricas se hará por intervalos. Por ejemplo la edad y el nivel 
de estudios de una muestra se pueden describir de esta forma: 

Tabla de frecuencia edad 



Frecuencia 

Porcentaje 

Porcentaje 

válido 

Porcentaje 

acumulado 

Válidos 

Joven 

30 

50,0 

53,6 

53,6 


Medía 

17 

28,3 

30,4 

83,9 


Mayor 

9 

15,0 

16,1 

100,0 


Total 

56 

93,3 

100,0 


Perdidos 

Perdidos 

del 

sistema 

4 

6,7 




Total 

4 

6,7 


Total 

60 

100,0 I 



Nivel de estudios 



Frecuencia 

Porcentaje 

Porcentaje 

válido 

Porcentaje 

acumulado 

Válidos Primarios 

18 

30,0 

30,0 

30,0 

Medios 

30 

50,0 

50,0 

80,0 

Superiores 

12 

20,0 

20,0 

100,0 

Total 

60 

100,0 

100,0 


















8.5.2. Representaciones gráficas 


Para ello se emplean diagramas en funeión del tipo de eseala según se 
muestra en el siguiente euadro: 

Cuadro 8.1. Tipos de gráficos según escaias 


Tipo de escaia 

Tipo de gráfico 

Vaiores que aparecen 

Nominal y ordinal 

• Diagrama de barras 

• Diagrama de 
sectores 

• Frecuencias 

• Porcentajes 

Métrica 

• Histogramas 

• Frecuencias 

• Porcentajes 


(iratico de sectores de la edad 


Perdido 
















Recuento 


Gráfico de barras de la edad 



edad 

Histogramas de la renta expresada en millones 




renta renta 


8.5.3. Medidas estadísticas descriptivas 

































8.5.3.1. Medidas de posición o tendencia central 


Son las que resumen la información aportada por todos los elementos en un 
valor central. Las medidas de posición más usuales son la media, la moda y la 
mediana. 




La media. Es una medida de tendencia central o de posición que resume 
la información obtenida en variables métricas o cuantitativas, como, por 
ejemplo, los ingresos de 100 establecimientos. Se calcula como: 



donde x¡ representa cada uno de los valores que toma la variable y n¡ el 
número de veces que ha tomado ese valor; n es el tamaño de la muestra. 
En investigación comercial no es muy frecuente utilizar variables 
métricas, pero si se emplean escalas de medida tipo la de Likert, que se 
pueden considerar en ocasiones como tales. La media no informa si hay, 
o no, disparidad de opinión, es decir, si todos le conceden la misma 
importancia o hay posiciones extremas, de ahi que cuando se utiliza la 
media se complete con otras medidas de dispersión. La media no se 
puede emplear con datos nominales ni ordinales y tampoco es 
conveniente cuando aparecen valores extremos de la variable o outliers. 
En este último caso se pueden eliminar las dos observaciones más 
extremas y calcularla con las restantes. 

• La moda. Es otra medida de posición o de tendencia central. Es la única 
aplicable cuando se trata de variables nominales. Es el valor, modalidad 
o intervalo que se presenta con mayor frecuencia. 

• La mediana. Esta medida se emplea con escalas de orden o métricas, no 
con nominales. Intuitivamente es el valor de la variable que divide a una 
distribución de frecuencias en dos; la mitad de los valores están por 
debajo de ella y la otra mitad por encima. Es muy difícil encontrar un 
valor en la práctica que actúe asi. Formalmente la mediana es el mínimo 
de los valores tal que la frecuencia acumulada es mayor o igual que el 
50%. 




8.5.3.2. Medidas de dispersión 


Complementan la información proporcionada por las medidas de posición. 
Indican si los valores se encuentran más o menos próximos a la medida de 
posición. Las más frecuentes son la varianza, la desviación tipica, el 
coeficiente de variación y el recorrido. La varianza y la desviación típica son 
medidas de dispersión de las variables métricas. La desviación tipica (S) es 
una distancia de los valores de la variable a la media. La varianza es esta 
distancia al cuadrado (S^). 

“ n 


5 = VF 


En general, cuando se trata de medir la disparidad de variables con 
distintas unidades de medida, para poder compararlas se utiliza un 
coeficiente exento de unidades, el coeficiente de variación. 

El coeficiente de variación. Se define como el cociente entre la 
desviación tipica y la media. 


Coef. = si X 0 

X 


Dada una media, cuanto mayor sea la dispersión mayor será el 
coeficiente de variación en valor absoluto. El signo del coeficiente sólo 
indica un mayor peso de los valores por encima o por debajo de la media. 

* El recorrido. Es una medida adecuada para medir la dispersión de las 
escalas métricas. Se cuantifica por la diferencia de magnitud entre el 
mayor valor de la variable y el menor. Sólo refleja los valores extremos. 
Una variable muy concentrada pero con dos valores extremos 
proporcionará un recorrido poco representativo. 


8.5.3.3. Medidas de deformación 







La forma de la distribución se mide con la asimetría y la curtosis. Una 
distribución se puede inspeccionar mediante su representación gráfica, pero 
esto es incómodo y engorroso. Además, los gráficos no se pueden tratar 
estadísticamente. La asimetría es un indicador del grado de igualdad de las dos 
mitades. Toma el valor cero cuando es simétrica. Puede haber asimetría hacia 
la derecha o hacia la izquierda. En el primer caso la media es mayor que la 
mediana y ésta mayor que la moda y en el segundo la media es menor que la 
mediana y ésta menor que la moda. Es muy importante conocer el grado de 
asimetría de una distribución para poder hacer inferencia. Si es muy 
asimétrica, el área de probabilidad bajo la curva difiere a ambos lados de ésta. 
Además, varias medidas de asociación entre variables no se pueden aplicar 
cuando las distribuciones no son nor-males. 

La curtosis mide el apuntamiento de la representación gráfica, trata de 
valorar la presencia de gran cantidad de observaciones próximas a la media y a 
la moda. Solo tiene interés cuando la distribución es simétrica. Un valor alto 
indica valores próximos a la media. 

Las fórmulas de la asimetría y de la curtosis son, respectivamente. 


Z(x, x]'n 
a.umctna - ^ , 

n (T 


mnosts 



n <T’ 


El siguiente cuadro muestra los estadísticos que pueden utilizarse en 
función del tipo de escala empleada. 

Cuadro 8.2. Medidas descriptivas según tipos de escalas 


Escala 

Medida de 
tendencia central 

Medida de 
dispersión 

Medida de la forma 
de la distribución 

Nominal 

• Moda 



Ordinal 

• Mediana 

• Moda 



Métrica 

• Media 

• Mediana 

• Moda 

• Desviación 

• Rango 

• Máximo y mínimo 

• Asimetría 

• Curtosis 


8.5.4. Estimaciones de los parámetros en la población 










Cuando se analiza una encuesta obtenida por muestreo se estiman la media 
de la población (si la variable fuera cuantitativa) y la proporción de población 
(si la variable fuera cualitativa) acompañadas de una medida de la fiabilidad, 
como se ha estudiado en el capitulo anterior. 

Para estimar la media o la proporción es necesario tener en cuenta si la 
muestra respeta la composición de la población. En caso de que esto no ocurra 
se procede a calcular las medias o porcentajes ponderados. 

Por ejemplo, en una empresa de construcción de 1000 empleados 100 
trabajan en administración y 900 en las obras. Una encuesta realizada a 100 
personas está compuesta por 40 trabajadores de administración y 60 de obra. 
Los trabajadores que conocen la existencia del comité de seguridad e higiene 
en el trabajo son 50, de los cuales 25 pertenecen a administración ¿Cuál es el 
porcentaje de los que conocen la existencia del comité? 


En administración 

25/40 

62,50% 

En obra 

25/60 

41,66% 

En la empresa 

0,4375 

43,75% 


10 25 90 25 

• + • =0,4375 



100 40^ I(K) 60 


8.6. ANÁLISIS DE LAS PREGUNTAS 
POR SUBGRUPOS 


Para ello se analizan las preguntas en los distintos subgrupos y se comparan 
entre si. Por ejemplo, los comportamientos de hombres y mujeres o por zonas 
geográficas. Los grupos suelen estar definidos por una variable nominal. 

• Si la variable a estudiar en los subgrupos es cualitativa, la 
descripción se realiza mediante tablas cruzadas, o de contingencia, 
con frecuencias o con porcentajes. Para determinar si las diferencias 
encontradas en los grupos son significativas se realizan contrastes de 
igualdad de proporciones. 



Cuando la variable es cuantitativa, se caleulan las medias en los 
diferentes grupos. Para determinar si las difereneias eneontradas en los 
grupos son significativas se realizan contrates de igualdad de medias. 


8.6.1. Tablas cruzadas. Descripción 

Una variable cuantitativa se puede convertir en cualitativa, en cuyo caso se 
puede utilizar la descripción mediante tabulaciones cruzadas. Las tabulaciones 
cruzadas son sencillas de realizar y de interpretar. Para emplear las 
tabulaciones cruzadas deben seguirse tres reglas básicas: 

1. Los datos pueden ser nominales, ordinales, de intervalos o métricas 
pero deben convertirse a categorias. 

2. El número de categorias debe ser limitado. 

3. Es conveniente que el número de categorias debe ser tal que el cruce 
tenga un número mínimo de frecuencias. De lo contrario, técnicas 
como el test chi-cuadrado no funcionan, aspecto que más adelante se 
verá. 

La tabla que se expone a continuación muestra las frecuencias de disponer 
de plaza de aparcamiento en su lugar de trabajo y la importancia que se da a la 
facilidad de aparcamiento del coche. 


t^image 


8.6.2. Contrastes para determinar la significación de 
las diferencias encontradas en los grupos 

8.6.2.1. Introducción a los contrastes de hipótesis 

En las secciones anteriores se ha estudiado cómo se resume la información 
de una muestra en unos parámetros: media, proporción, desviación tiplea, etc. 
A veces esto genera resultados más o menos sorprendentes. Es necesario 
preguntarse si los resultados obtenidos son debidos a la casualidad o están 


reflejando la realidad, es deeir, si estas difereneias son reales o simplemente se 
deben a las fluetuaeiones de la muestra. 

Hay que tener en euenta que si se utiliza una muestra, los estadistieos, 
media, proporeión, ete., son aleatorios y distintas muestras pueden generar 
valores diferentes. La difereneia entre las medias obtenidas en los dos grupos 
puede ser debida únieamente a las fluetuaeiones muéstrales, y en este easo no 
interesarla dar un tratamiento diferente a ambos grupos. Por el eontrario, si 
fueran diferentes, uno de ellos podría eonstituir el segmento objetivo. En el 
eontraste de hipótesis se trata de depurar los resultados mediante un estudio 
más a fondo. Una hipótesis estadistiea es una afirmaeión o eonjetura eon 
respeeto a alguna earaeteristiea de interés. Por ejemplo: 

«La proporción de andaluces que votan a un determinado partido, es como 
mínimo el 30%». 

Contrastar una hipótesis estadistiea es deeidir si la afirmaeión se eneuentra 
apoyada por la evideneia muestral. A través del eontraste se utilizan los 
resultados de la muestra para aeeptar o reehazar la hipótesis o afirmaeión 
básiea. 

• Hipótesis nula 

Una prueba de hipótesis eomienza estableeiendo la hipótesis de eontraste 
denominada hipótesis nula H^. 

Las hipótesis pueden surgir examinando los resultados de una eneuesta o 
bien de los propios problemas del mereado. Veamos algunos ejemplos: 

• Un gerente se plantea la posibilidad de eontinuar o no eon una eampaña 

publieitaria. Si el produeto es eonoeido al menos por el 60% de la 
poblaeión, no interesa eontinuar; en easo eontrario, si. El gerente se 
plantea la hipótesis nula siguiente: {la proporeión de personas que 

eonoeen el produeto p > 0,6}. La informaeión empiriea obtenida de una 
muestra le permitirá aeeptar o reehazar esta hipótesis. 

• En el laboratorio se ha desarrollado una nueva fórmula para un limpiador 
más eara que la utilizada aetualmente. El problema es deeidir si se eonti 



núa con la fórmula actual o se sustituye por la nueva. Este cambio será 
conveniente únieamente si hay evidencia de que el consumidor considera 
que el nuevo produeto es mejor. En este easo se eontrastará la hipótesis 
nula de que la valoraeión media eoncedida al primero no es peor que la 
del segundo. 

{la nota media concedida al limpiador aetual m^^ no es peor que la 
nota media concedida al nuevo, m^ > m^,}. 

Si existe suficiente evideneia en contra, se reehazará esta hipótesis y, en 
eonsecuencia, se considerará que ha habido una mejora con la nueva fórmula. 
La hipótesis nula se considera como verdadera salvo que exista suficiente 
evidencia en eontra. 

• La región de rechazo 

Una prueba de hipótesis estadistiea eon respeeto a algún parámetro 
deseonoeido de la población, es una regla para decidir si se reehaza la 
hipótesis nula basándose en una muestra aleatoria. La regla se apoya en los 
resultados de la muestra, más coneretamente, en un estadístico obtenido con 
los resultados muéstrales. 

Freeuentemente se utilizan la proporeión muestral y la media muestral. Asi, 
para contrastar la hipótesis de que la proporeión de personas que eonoeen el 
produeto es al menos el 60% se tomará una muestra y se ealeulará la 
proporción muestral. Si este valor muestral es inferior a un valor eritieo, se 
reehaza la hipótesis. El conjunto de valores para los que se reehaza se 
denominan “región eritica” de la prueba. Asi, si la proporción muestral p es 
menor que 0,52, se reehaza la hipótesis nula y la región critiea es (0; 0,52). 

• Las probabilidades de error 

Cuando se realiza una prueba se pueden tomar dos decisiones: reehazar la 
hipótesis nula H^, y no reehazar la hipótesis nula Las decisiones aparejan 
riesgo. Se pueden tomar decisiones erróneas y eometer dos tipos de errores: 


Error tipo I. Reehazar la hipótesis nula cuando en realidad es cierta. 



Error tipo II. No rechazar la hipótesis nula cuando en realidad es falsa. 


Obsérvese que si la decisión es rechazar, sólo se puede cometer el error tipo 
I, mientras que si la decisión es aceptar, sólo se puede comete error tipo II. 
Estos riesgos de que las fluctuaciones de la muestra conduzcan a decisiones 
erróneas se pueden acotar. 

• La hipótesis alternativa y la región crítica 

Las probabilidades de error dependen del tamaño de la muestra. 
Generalmente disminuyen al aumentar éste, pero también dependen de la 
región critica o región de rechazo. 

Para diseñar una prueba se suele comenzar estableciendo el nivel de error 
tipo I máximo que se está dispuesto a aceptar, denominado nivel de 
significación de la prueba, a, y se fija la región critica de manera que el error 
tipo I no sobrepase esa cota. 

Generalmente el nivel de significación, a, o mayor probabilidad de error 
admitida se fija en un 5% o 1%, incluso en un 1 %o. Es decir, se diseñan 
pruebas de manera que si se rechaza la hipótesis, la probabilidad de 
equivocarse sea muy pequeña. 

• La decisión 

Cuando el estadístico cae en la región crítica existe evidencia empírica para 
rechazar la hipótesis. En caso de que el estadístico no caiga en la región 
crítica, no se puede rechazar la hipótesis, pero eso no garantiza que la 
hipótesis sea cierta, sino únicamente que no prueba su falsedad; no se tiene 
evidencia apoyada en la muestra de que sea falsa. 

Obsérvese que el error que se está acotando es el error tipo I, el que se 
comete cuando se rechaza. De ahí que la decisión generalmente consista en 
rechazar o no rechazar. Al tomar la decisión de rechazo se sabe qué error se 
comete, a, pero no se controla el error de aceptar. 

Para tomar la decisión se toma una sola muestra. Si se obtiene un valor 
muestral para el estadístico, dentro de la región crítica, está muy alejado de la 
hipótesis nula: está en una zona en la que cuando es cierta la hipótesis nula es 



muy poco probable. De ahí que se eonsidere no que haya oeurrido algo poeo 
probable (un aeeidente muestral), sino que no es eierta la hipótesis, y por eso 
se reehaee la 

No obstante, siempre existe la posibilidad de haber obtenido una muestra en 
la que han eoneurrido valores poeo freeuentes y que realmente sea eierta la 
hipótesis nula, pero esa situaeión es remota y su probabilidad está aeotada en 
a. 


Otra forma de plantearse el problema de eontraste de hipótesis es 
determinar la probabilidad de que el resultado haya sido easual. Cuando la 
probabilidad de que, siendo eierta la hipótesis nula, el estadístieo tome un 
valor a una distaneia mayor o igual que la del valor observado, p, es menor que 
el nivel de signifieaeión previsto a, se reehaza la hipótesis nula. Esta 
probabilidad se denomina grado de signifieaeión y representa el peso de la 
evideneia para reehazar la hipótesis nula. 

Supongamos que se trata de eontrastar la hipótesis de que la proporeión de 
personas que eonoeen un produeto es 0,6. Para ello se ha tomado una muestra 
de 100 individuos, en la que la proporeión de los que eonoeen el produeto es p 
^ 0,52. ¿Qué probabilidad existe de obtener una proporeión de 0,52 o menor en 
una muestra de tamaño 100, si la proporeión real de la poblaeión es 0,6? 

Si esta probabilidad se ealeula en 0,2 signifiea que hay 20 posibilidades de 
eada 100 de obtener esa respuesta 0,52, siendo realmente 0,60, y que la 
difereneia entre 0,52 y 0,6 se puede deber al muestreo: son simples 
fluetuaeiones, y no está justifieado reehazar la hipótesis. Pero si este valor es 
pequeño, por ejemplo 0,015, podemos reehazar la hipótesis nula, la difereneia 
se eonsidera signifieativa y es poeo probable que sea un aeeidente de 
muestreo. 

Con este planteamiento el diseño sigue las siguientes fases: 

1. Estableeer las hipótesis. 


2. Fijar el nivel de signifieaeión a. 



3. Buscar el estadístico adecuado para la información disponible y su 
distribueión. 

4. Determinar la región crítica o de rechazo. 

5. Calcular el estadístico. Si éste cae en la región crítica, se rechaza la 
hipótesis nula. 

6. Alternativamente se calcula el grado de significación o valor p 
correspondiente al estadístico. Si p es menor que el nivel de 
significación de la prueba, se rechaza la hipótesis nula al nivel de 
signifieaeión a. 

8.6.2.2. Contrastes para comparar a través de las medias 

Están pensados para resolver, entre otros, una situaeión que surge con 
frecuencia en investigación comercial. En un estudio empírico en dos 
poblaciones se han detectado diferentes valores medios. ¿Esta diferencia 
observada es significativa?, ¿es suficiente para aceptar que las dos poblaciones 
tienen diferente media o es, simplemente, consecuencia de las fluctuaciones 
muéstrales? 

Por ejemplo, en un estudio se obtuvo que la importancia media dada a la 
facilidad de aparcamiento era de 2,16 en el grupo que dispone de plaza de 
aparcamiento y de 4,3 en el que no dispone de ésta. ¿Estas diferencias son 
reales o son fruto de las fluctuaciones muéstrales? 

Existen diversos tests diseñados para responder al problema planteado y a 
otros más generales. En todos ellos se contrasta la hipótesis de que son iguales 
en media. Existen varios contrastes aplicables a diferentes situaeiones según 
se disponga de una o más muestras, independientes o no. 

En todos los easos se considera la siguiente notación: 

«2 son los tamaños de las muestras en el grupo 1 y 2 respectivamente 

l^ima es la media muestral en la primera población o grupo 

ge 

1 


Kima es la media muestral en la segunda poblaeión 

ge 

2 

Sj, S 2 desviaeión típiea de las muestras 

es el euantil de la distribución t el de Student 
es el euantil de la distribución Normal 

a es el nivel de significación fijado por el analista 

• Dos muestras independientes 

Compara las medias de la variable en dos grupos de casos. Supone que los 
componentes de cada grupo han sido asignados de forma aleatoria, es decir, 
son dos muestras independientes. En el caso de que se disponga de una sola 
muestra clasificada en dos grupos estos se deben definir por un criterio 
aleatorio, no uno relacionado con otros factores que influyan sobre las 
diferencias. En el caso de un muestreo estratificado, las muestras en cada 
estrato son independientes; luego si los grupos corresponden a estratos 
diferentes, se puede utilizar este contrate. Cada muestra procede de una 
población normal. 

La hipótesis que se contrasta es que las medias en los dos grupos son 
iguales. La alternativa es que son diferentes. 

Se distinguen dos casos: 

1. Cnando las varianzas son ignales 

Entonces se calcula el estadistico 


Klimage 

Si |í| > t^i 2 con n¡ + n 2 - 2 grados de libertad, se rechaza la hipótesis de 
contraste al nivel de significación a, es decir, se rechaza que los dos grupos 
tengan la misma media y se acepta que son diferentes. 

Alternativamente se puede calcular el valor p a partir de este estadistico y 
rechazar la hipótesis si p<a. Cuanto mayor sea p, más significativas son las 


diferencias. 


2. Cuando las varianzas son diferentes 

Se calcula el estadístico 


Kimage 

Si |z| > z^i 2 se rechaza la hipótesis de contraste al nivel de significación a, 

es decir, se rechaza que los dos grupos tengan la misma media y se acepta la 
alternativa de que son diferentes. Alternativamente se puede calcular el valor p 
a partir de este estadístico y rechazar la hipótesis si p < a. Cuanto mayor sea p, 
más significativas son las diferencias. Los tamaños muéstrales necesarios para 
poder aplicar este test son n^ >100 ; n 2 >100. 

Los contrastes de diferencias de medias se pueden diseñar también para 
contrastar que la diferencia sea superior a una cantidad en lugar de 0. Sin 
embargo, las aplicaciones más frecuentes de este test son para contrastar si dos 
colectivos son iguales en cuanto a su media, o son diferentes, en cuyo caso se 
podrian llevar acciones de marketing diferentes. Tienen también una clara 
aplicación a los estudios de test de producto, como se muestra en el ejemplo 
siguiente. 

Un test de producto monódico. Una empresa dispone de dos productos 
semejantes A y B. A está ya comercializado. La pregunta obligada antes de 
tomar una decisión de lanzar B al mercado es: ¿el público percibe diferencias 
entre estos dos productos? 

Para resolver este interrogante se eligen dos muestras aleatorias diferentes, 
cada una de ellas compuestas por 100 personas a las que se les pide que 
prueben el producto y lo evalúen en una escala de 1 a 10. Las calificaciones 
medias obtenidas son de 7,6 y 8,2 para A y B respectivamente con varianzas 
4,8 y 5,6. 

El problema se puede plantear de la forma siguiente: se contrastará la 
hipótesis nula de que el mercado en general (no la muestra) valora al producto 
B igual que al A, frente a la alternativa de que son diferentes. Si A está en el 
mercado y B no, pero lanzar B supone un coste mayor que el mantenimiento 


de A, la empresa sólo tomará la decisión de sustituir A por B en el caso de que 
haya clara evidencia de que B es más valorada que A. 

Se calcula el estadístico: 


t^image 

Al nivel de significación a= 0,05, z ^/2 ^ Dado que z ^/2 = 1,96 > |z| = 
1,86. No se rechaza la hipótesis de que ambos productos son igualmente 
valorados, la información existente no permite afirmar que sean diferentes. 
Téngase en cuenta que se está acotando la probabilidad de cometer el error de 
rechazar la igualdad cuando realmente son iguales en 0,05; no se acota el otro 
tipo de error. 

De igual forma, utilizando un programa de ordenador, una vez seleccionada 
la prueba adecuada proporciona el valor p, grado de significación del valor 
observado del estadístico. 


p-P [IX 1 -X 2 I >0,52] - 0,06 


con p = 0,06 > 0,05 - a no se rechaza la hipótesis de igualdad en la valoración 
de ambos productos. No obstante el grado de significación 0,06, este valor p 
está próximo al nivel de significación. No está muy alejado del nivel de 
rechazo. 

• Dos muestras dependientes o pareadas 

Es frecuente que las muestras que sirven para contrastar si dos colectivos 
tienen la misma media, no sean independientes, incluso que sea la misma 
muestra la que ha respondido a dos preguntas resumidas a través del cálculo de 
las medias. Esto se produce, por ejemplo, en los test de producto cuando es la 
misma muestra la que evalúa los dos productos, es decir, cada individuo valora 
ambos productos. 

En este caso hay correlación entre la evaluación de ambos productos, 
aunque no siempre se evalúan A y B en el mismo orden. Es decir, unos 
individuos califican al principio Aya continuación evalúan B y otros lo harán 
en orden inverso. La hipótesis que se contrasta es que las medias en los dos 
grupos son iguales. La alternativa es que son diferentes. El procedimiento 



consiste en calcular, para cada individuo i de la muestra, la diferencia entre las 
calificaeiones otorgadas a B y A. 


“ ^Ai “^Bi 


se calcula la media de la variable diferencia 

Kimage 

La regla de deeisión al nivel de significaeión a será si 

Kimage 

se rechaza la hipótesis nula (S¿ es la masidesviaeión típica de la variable 
diferencia; los grados de libertad de la distribución t son n-1). 

Por ejemplo, para eontrastar si un nuevo diseño de produeto es mejor 
considerado que el existente aetualmente en el mereado, se tomó una muestra 
de n ^ 30 individuos, los cuales evaluaron ambos productos en una escala de 1 
a 10, obteniendo los siguientes resultados: 

t^image 

Contrastar al nivel a ^ 5% si se puede eonsiderar que ambos produetos son 
igualmente valorados. 

Se calcula la media de las diferencias dj ^ -0,8 y su cuasidesviación tiplea 
en Sj ^ 1,2. 

Para un a ^ 0,05 se tiene que, 

t^image 

Idj ^ 0,8 > 0,47 luego se rechaza la hipótesis de que no existe difereneia 
pereibida entre los dos productos con un riesgo o error máximo de 5%. 

• Comparación de más de dos grupos. Análisis de varianza de un factor 

Se puede plantear el contraste de que la media en más de dos grupos es la 
misma, es una extensión de la prueba para dos muestras. Entonces se realiza 



un análisis de varianza. 


Se emplea para eontrastar la igualdad de las medias de una variable en 
varios grupos definidos por una variable eualitativa. Es una téeniea que se 
emplea euando se desea saber si los valores medios de la variable que se 
estudia para eada eategoria de la variable que los define difieren de forma 
signifieativa. Para poder apliear el análisis e la varianza debe eumplirse las 
siguientes eondieiones: 

a. La variable independiente que define los grupos debe ser eategóriea. 
Por ejemplo, tipo de tienda, dia de la semana, elase de envase, ete. 

b. La variable dependiente, la que se eompara, debe ser métriea: por 
ejemplo, la eifra de ventas de una marea, de un estableeimiento, ete. 

e. Los valores de la variable dependiente deben obtenerse de grupos 
distintos, independientes. Ningún sujeto debe estar en los dos grupos de 
forma simultánea. 

d. La varianza dentro de eada eategoria de la variable independiente debe 
ser pareeida. 

e. Las distribueiones deben ser normales. 

f. Debe haber dos o más eategorias. 

g. Los grupos no tienen por qué ser del mismo tamaño. 

h. La asimetria y la eurtosis de las variables dependientes deben ser 
pareeidas. 

El leetor puede eonsultar ejemplos de aplieaeión de análisis de la varianza 
en Experimentaeión Comereial, apartado 5.7. 

8.6.2.3. Contrastes para comparar a través de las proporciones 

Cuando se trata de eomparar dos eoleetivos en los que se han estudiado 
variables nominales, no métrieas, se eomparan a través de las proporeiones. 
Por ejemplo: ¿el grado de interés por un servieio nuevo es el mismo en dos 
zonas geográfieas? o ¿es el mismo en las personas jóvenes y en los mayores? 
¿La proporeión de personas interesadas por el servieio ha variado después de 



una campaña publicitaria? Estos problemas se resuelven mediante un contraste 
de igualdad de proporciones en ambos coleetivos. 

• Contraste para la diferencia de proporciones con dos muestras 
grandes e independientes 

Para realizar el eontraste se dispone de dos muestras aleatorias e 
independientes de tamaños n^ y n 2 ambas. Obteniéndose como frecuencias o 
proporciones muéstrales fj y f 2 respeetivamente. 

Se contrasta la hipótesis nula: en ambos colectivos la proporción es la 
misma frente a la alternativa de que son diferentes. 

Al nivel de signifieación a, si 


Kimage 

se rechaza la hipótesis de que son iguales en favor de la alternativa de que son 
diferentes, donde 


t^image 

Para poder aplicar esta prueba es neeesario que se cumpla en eada muestra 
que nfi y (l-f) sean al menos 5 

Veamos un ejemplo. Para estudiar si el grado de interés (desconocido) de un 
producto en dos regiones A y B es el mismo se han tomado sendas muestras 
aleatorias independientes de tamaños respectivos n^ = 100 y ng ^ 50, 
obteniéndose que en la región A el 23% de la muestra está interesada en el 
produeto, y en la región B lo está el 27% de la muestra. 

¿Existe evideneia de que ambas regiones son diferentes en euanto a su 
interés por el producto? 

Para responder a esta pregunta se plantean las hipótesis siguientes: 

Hipótesis de contraste: el interés es el mismo en ambas poblaciones, es 
deeir, la proporción de personas interesadas eoincide en las dos regiones. La 
hipótesis alternativa es que son diferentes. 


Se calcula 

Kimage 

Dado que 0,04 <0,145 al nivel a= 5% no se rechaza la hipótesis de que son 
iguales. No existe evidencia suficiente que permita decir que son diferentes. 
Obsérvese que se desconoce el error que se comete al aceptar la igualdad. 

Existen otros contrastes de diferencia de proporciones adecuados para el 
caso en que las muestras no sean independientes. 

8.6.2.4. Contrastes para comparar a través de mediana. Test de la 
mediana 

El test de la mediana permite comparar dos grupos de igual forma que el 
test de la diferencia de medias y el de proporciones. La comparación se hace 
en este caso a través de las medianas. Por lo tanto, es adecuado para variables 
de orden y métricas. 

Se utiliza frecuentemente para elegir las preguntas relevantes para un 
cuestionario a partir de una encuesta piloto. 

Consideremos dos grupos independientes en los que se ha medido una 
variable, en una escala de orden o métrica. La hipótesis de contraste es que 
ambos grupos tienen la misma mediana, frente a la alternativa de que la 
mediana de una población es mayor que la de la otra. 

El procedimiento comienza calculando la mediana de todos los valores de 
ambas muestras, como si se tratara de una sola. A continuación se divide cada 
grupo original en dos: aquellos que toman valores inferiores o iguales a la 
mediana y los que toman valores superiores. 

Se obtienen asi cuatro clases de efectivos. A, B, C y D respectivamente, 
como se recoge en la tabla. 



Grupo 1 

Grupo II 

Número de observaciones con 
valores superiores a la mediana 

A 

B 












Número de observaciones con 

C 

D 

valores inferiores o iguales a la 



mediana 




m 

n 


N = m+n 


Se calcula el estadístico: 

t^image 

Si N ^ m + n > 20 la región crítica se determina a partir de la distribución 
X^. En caso contrario se emplea la distribución de Fisher. Si N>20 se 
rechazará la hipótesis de igualdad de medianas al nivel de significación a si z 
> con un grado de libertad. 


Veamos un ejemplo. Cuando se diseña un cuestionario para estudio de 
opinión o actitudes, es frecuente diseñarlos inicialmente con un número 
excesivamente alto de preguntas, que hacen el cuestionario largo. Para 
seleccionar las preguntas más relevantes se puede hacer una prueba piloto. 
Supongamos que se desea juzgar la relevancia de una pregunta valorada con 
una escala de Likert de 1 a 5. Se considera relevante cuando aparece 
diversidad de respuestas. Si todos los individuos respondieran igual, la 
inclusión de la pregunta no aportaría más información. 

Para realizar el contraste se toman en la encuesta piloto dos grupos: 

• Grupo 1, compuesto por un 25% de los elementos de la muestra, aquellos 
que en el conjunto del cuestionario hayan concedido una valoración total 
más alta. 

• Grupo 2, compuesto por un 25% de los elementos de la muestra, aquellos 
que en el conjunto del cuestionario hayan concedido una valoración total 
más baja. 

Con estos dos grupos se realiza el contraste de diferencia de medianas. 

Supongamos que cada grupo lo componen 12 personas. Se comienza 
calculando la mediana del conjunto suma de los dos, formado por 24 personas, 
que recibe el nombre de mediana combinada. 








Se calcula entonces la tabla siguiente: 



Grupo 1 

Grupo II 

Número de observaciones con valores 
superiores a la mediana 

4 

9 

Número de observaciones con valores 
inferiores 0 iguales a la mediana 

8 

3 


12 

12 


12 + 12 = 24 


Bajo la hipótesis de que la mediana en ambos grupos es la misma, el 
estadístico z es: 

z - 24 ( |4 • 3 - 9 • 8 | -24/2)2/(4+9)(8+3)(4+8)(9+3) - 2,68 

Como N ^ 24, se busca el valor critico X^q 95 con 1 grado de libertad, que 
toma el valor 3,84. 

Dado que z es menor que 3,84, se rechaza la hipótesis de que ambas 
medianas son iguales, es decir, la pregunta es relevante. 


8.7. ANÁLISIS DE LAS 
RELACIONES ENTRE 
PREGUNTAS O VARIABLES 


Un estudio básico debe contemplar la posibilidad de que dos variables estén 
relacionadas y determinar estas asociaciones. Ya se ha presentado un 
procedimiento descriptivo para estudiar las relaciones entre dos preguntas, 
variables nominales o de intervalos: son las tablas cruzadas o de contingencia. 
En este apartado se recogen algunos procedimientos de análisis de 
información que permiten responder a dos preguntas: 

• ¿Existe relación entre dos variables? 

• ¿Cuál es la intensidad de la relación? 











Se han desarrollado medidas del grado de asociación para todo tipo de 
variables: 

• Coeficiente de correlación lineal para variables métricas. 

• Coeficientes de Cramer, Phi, o de contingencia para variables nominales. 

• Coeficientes de correlación no paramétricos como los de Spearman, Tan 
y W de Kendall, etc. para variables ordinales. 

Los más utilizados son los siguientes: 


8.7.1. Relación entre variables cuantitativas 


8.7.1.1. Medida de la relación entre variables: El coeficiente de 
correlación lineal o de Pearson 


Este parámetro mide el grado de asociación lineal entre dos variables 
cuantitativas, X e Y. 
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donde y SySon las correspondientes desviaciones tipicas y S^y la 
covarianza. El coeficiente de correlación, r, entre dos variables X e Y toma 
valores entre -1 y 1, es decir -1 < r < 1. 

• Si r, en valor absoluto, toma un valor próximo a 1, indicará que hay 
mucha asociación entre las dos variables. 

• Si es próximo a 0, la asociación lineal es pequeña, y nula cuando r es 0. 

• Si r es próximo a 1, y toma valor positivo, la asociación es creciente, es 
decir, a medida que X crece, Y también lo hace. 

• En el caso extremo en que r ^ 1 la asociación es perfecta. 

• Si r es próximo a 1 y toma valores negativos, la asociación es inversa. A 
medida que X crece Y disminuye. 

• Esta asociación es perfecta cuando r = -1. 

• Cuando r ^ 0, no existe una relación lineal entre ellas. 



Consideremos el siguiente ejemplo: X indiea el gasto en informaeión al 
trabajador en millones en diferentes empresas, e Y el número de aeeidentes 
laborales en la empresa durante el último año. 


Zona 

A 

Y 

a 

1,2 

9 

b 

1,4 

7 

e 

1,6 

6 

d 

2 

5 

e 

2,4 

4 

f 

1,1 

9 

g 

1,5 

7 


El valor que toma r en este easo -0,96 indiea que hay una relaeión lineal 
alta, negativa, gastos mayores en informaeión se eorresponden eon menor 
número de aeeidentes. Si r fuera próximo a 0 indiearia que práetieamente no 
hay relaeión lineal entre los gastos y el número de aeeidentes; esta relaeión 
será totalmente inexistente si r ^ 0. 

Obsérvese que el eoefieiente de eorrelaeión indiea el grado de asoeiaeión 
lineal entre dos variables, no indiea euál de las dos variables es la que influye 
sobre la otra, debe ser el investigador el que deeida esta euestión. Asi en el 
ejemplo eonsiderado, el eonoeimiento previo del problema indiea que, de 
haber influeneia, será la de los gastos en informaeión sobre el número de 
aeeidentes y no al revés, pero no es el eoefieiente de eorrelaeión quien indiea 
ésta. 

El eoefieiente de eorrelaeión indiea el grado y sentido de la relaeión lineal, 
pero no indiea eómo es esta relaeión. Cuando se deteeta que hay relaeión suele 
ser interesante formalizar la relaeión, para lo eual se utiliza la regresión. 

El eoefieiente de eorrelaeión lineal tampoeo deteeta otras asoeiaeiones 
eomo la eireular, pero estas asoeiaeiones no son usuales en la práetiea. 


8.7.1.2. Contraste de correlación 




El objetivo de este eontraste es deeidir si la eorrelaeión obtenida r es 
signifieativa o si por el eontrario puede deberse a fluetuaeiones al azar. La 
hipótesis nula es que no existe eorrelaeión lineal. 

Se caleula el estadístico 
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Si el estadístico es mayor que el valor de la distribución t de Student con n- 
2 grados de libertad al nivel a, se rechaza la hipótesis nula y se acepta que 
están relacionadas. 


8.7.2. Relación entre variables cualitativas 

Las tablas de contingencia permiten estudiar las relaciones entre dos 
características o variables nominales. La simple observación de una tabla 
puede ser compleja si su dimensión fuera grande. Las diferencias visualmente 
observadas entre unas categorías y otras que podían sugerir relaciones pueden 
ser debidas únicamente a las fluctuaciones muéstrales. 

S. 7.2.1. ¿Existe relación entre variables? Test de chi-cuadrado 

Esta prueba contrasta la hipótesis nula de que ambas variables o 
caracteristicas son independientes. La hipótesis alternativa es, por tanto, que 
no son independientes, es decir, que existe relación entre ellas. Dada una tabla 
de contingencia con f filas y c columnas, de frecuencias n^, se realiza el 
siguiente contraste: 

Se calcula el estadístico 
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Si el valor del estadístico es mayor que el valor en tablas de la distribución 
chi-cuadrado con (f-l)(c-l) grados de libertad, al nivel de significación a, se 
rechaza la hipótesis nula y se acepta que existe relación entre ambas variables. 

Para poder realizar la prueba es necesario que las frecuencias teóricas n¿ 
imagede las casillas sean 5 como mínimo y el tamaño de la muestra 


mínimo es de 50. 


Veamos un ejemplo. Se desea estudiar si existe relaeión entre la opinión 
sobre la aetuación del eomité de seguridad e higiene en el trabajo y diversos 
seetores sindieales. Para ello se ha tomado una muestra de trabajadores, 
obteniéndose las siguientes frecueneias de opinión sobre el eomité: 
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De aeuerdo eon estos datos el estadístieo toma un valor de 98,10. El 
valor en tablas de la distribueión ehi-euadrado eon (f-l)-(c-l) grados de 
libertad (4), es 9,88, menor que 98,10. Luego se reehaza la hipótesis de 
independencia entre la opinión sobre el comité y la pertenencia a una rama de 
productividad. Es decir, la opinión sobre el comité varía por sectores. 

En el siguiente ejemplo, la tabla de frecuencias establece la relación entre el 
grado de satisfacción con el pediatra y el nivel cultural de la madre. La 
satisfacción se mide entre 1 y 5. Es la variable SATIS. La hipótesis nula que se 
va a contrastar es que el nivel cultural y el grado de satisfacción con el 
pediatra son independientes, no están relacionados. 

Hq = {el nivel cultural no influye sobre el grado de satisfacción con el 
pediatra. Ambas variables son independientes} 

A partir de la tabla de frecuencias se obtiene: 
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El grado de significación 0,000 < 0,05. Al nivel a = 0,05% se rechaza la 
hipótesis nula, luego no son independientes; el nivel cultural parece que 
influye sobre el grado de satisfacción. Debe tenerse mucho cuidado al aplicar 
esta herramienta. Encuentra relaciones, pero no establece relaciones causales. 

Otra forma de realizar el contraste es fijarse en el estadístico chi-cuadrado, 
que toma un valor 60 > 12,6 que es el valor crítico en tablas con 6 g.l. al nivel 
a = 0,05%. Según este resultado se rechaza la hipótesis nula: el nivel cultural y 
el grado de satisfacción no son independientes. 

Ahora bien, la prueba realizada no es válida, ya que no se cumple la 
condición de que las casillas teóricas tengan una frecuencia al menos de 5. Es 


necesario recodificar las variables en menos categorías antes de realizar el 
análisis. 

8.7.2.2. Medidas de cuantificación de la asociación entre las 
variables cualitativas 

Una vez comprobado que existe relación entre dos variables cualitativas, se 
trata de estudiar cuál es la intensidad y la dirección de la asociación. Existen 
diversas herramientas. 

Cuando todas las variables son dicotómicas 

• Coeficiente cp. Se emplea cuando las variables son por naturaleza 
dicotómicas, por ejemplo sexo y tener empleo. El coeficiente cp se 
calcula a partir de una tabla: 



C1 

C2 

F1 

a 

b 

F2 

c 

d 
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C1 

C2 

F1 

130 

1600 

F2 

1400 

240 


Por ejemplo. El y F2 pueden representar, respectivamente, estar en paro o 
tener empleo, y C1 y C2, respectivamente, tener estudios y no tenerlos. El 
coeficiente (p medirá la correlación entre tener estudios y encontrar trabajo. A 
partir de la tabla anterior. 


t^image 
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Para poder aplicar el coeficiente cp el tamaño de la muestra debe ser mayor 
que 100. Para poder interpretar (p debe calcularse el valor máximo. 
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Siendo: Pi la mayor proporción marginal de una variable 

Qj la mayor proporción de la otra variable 

El cociente imageindica el tanto por uno que (p es de Por lo tanto 
^ image 

representa el valor de la correlación de Pearson que, en cuanto al grado de 
relación, es aproximadamente (p. 

Según los datos expuestos, las proporciones son para las columnas 

1530/3370-0,454 

1840/3370-0,546 


y para las filas 


1730/3370-0,513 

1640/3370-0,487 

P; la mayor proporción marginal de una variable es 0,546 

Qj la mayor proporción de la otra variable es 0,513 
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Luego el valor de cp corregido es 0,78 / 0,9359 - 0,83 

• Correlación tetracórica. Se emplea cuando una variable es continua y la 
otra dicotómica (o continua) pero ambas se encuentran dicotomizadas. 
Por ejemplo, se puede medir la correlación entre una variable continua, 
la altura (dicotomizada; hasta 1,8 m. y 1,8 m. o más), y otra dicotómica, 
aprobar o no aprobar unas pruebas físicas para ser vigilante de seguridad 

Klimage 

En esta tabla 150 aspirantes no llegan a 1,8 m. y 50 llegan a esta altura o la 
superan. 125 han sido suspendidos en unas pruebas físicas para vigilantes de 
seguridad y 75 han aprobado. La tabla muestra la distribución de frecuencias 


conjunta del éxito en el examen y la altura. Se puede medir la influencia de la 
altura en los resultados mediante una correlaeión tetraeórica: 



C1 

C2 

F1 

a 

b 

F2 

c 

d 
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En el ejemplo 
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se aprecia que la correlación es muy escasa. Para interpretar la correlación 
tetraeórica debe tenerse en cuenta que 

1. Toma los mismos valores que la de Pearson y se interpreta igual. 

2. El número total de frecueneias ha de ser 100 como mínimo para 
aplicarla. 

3. No puede haber freeueneias nulas o muy inferiores a las demás. 

4. Ninguna frecuencia puede ser muy inferior a las demás. 

5. Ninguna proporción marginal debe ser inferior a 0,05. 

* Cuando las variables no son dicotómicas 


• El coeficiente de contigencia C es una medida del grado de asociación 
entre dos conjuntos de eategorias. Es muy útil cuando se trata de medir la 
asociación entre variables nominales. Su expresión es 

t^image 

Donde es el estadistieo ehi-cuadrado de una tabla de contingencia, y N es 
el tamaño de la muestra. En la tabla de c columnas y f filas que se muestra a 
continuación aparecen las frecuencias cruzadas de clases sociales tipos de 
estudios realizados. 
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El estadístico toma, con estos datos, un valor de 98,10. Su valor en tablas 
con (f-1) • (c-1) ^ ( 3-1) • (3-1) grados de libertad (4) es 9,840. Luego se 
rechaza la hipótesis de independencia entre clase social y estudios cursados. 
Considerando que el tamaño de la muestra es 990, el coeficiente C vale 
0,2641. 

Este valor es el que debe tomarse cuando el número de filas y columnas no 
coinciden. Cuando el número de filas coincide con el de columnas, C debe ser 
corregido, de acuerdo con valor máximo que puede tomar. 

El máximo valor que puede tomar C es 

t^image 

Siendo K el número de filas o columnas. El valor de C corregido 1^ image 

indica el tanto por uno que C es del es algo equivalente al . En este 
caso K ^ 3, luego el máximo valor de C es l^mage. El valor de C corregido, 
0,2641/0,8165 = 0,3234. La asociación entre clase social y estudios realizados 
no es escasa. 

• Coeficiente de Cramer. Es una medida del grado de asociación entre dos 
conjuntos de atributos o variables. Sólo se puede emplear con variables 
nominales. Se calcula a partir de una tabla de contigencia, como el 
coeficiente C. Su expresión es 
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Donde es el estadístico chi-cuadrado, N el tamaño de la muestra y L el 
menor número de clases, filas o columnas. Con los datos de la tabla anterior C 
- 0 , 22 . 


8.7.3. Medida de la relación entre variables ordinales 

8.7.3.1. El coeficiente de correlación de rangos o de Spearman 

Mide el grado de asociación de dos variables medidas con una escala de 
orden. Por lo tanto, también es aplicable a variables métricas. 


Dadas dos variables, o preguntas, el coeficiente de Spearman r^ se calcula 
como el coeficiente de correlación lineal r, pero utilizando los órdenes en 
lugar de los valores. Se obtiene asi la expresión. 
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donde n es el tamaño de la muestra o número de observaciones y dj la 
diferencia de rangos de la observación i en ambas variables. 

El valor de r^ se encuentra entre -1 y +1. La interpretación es idéntica a la 
de r, correlación de Pearson, ya expuesta. 

Veamos un ejemplo. Supongamos que se desea estudiar el grado de 
asociación que existe entre dos personas que han ordenado sus preferencias 
sobre distintas caracteristicas de un coche de la siguiente forma: 
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Con estos datos, y aplicando la fórmula, se concluye que r^ ^ 0,82. 

El coeficiente es alto y positivo. Existe una elevada asociación entre las 
preferencias de ambas personas. 

8.7.3.2. Coeficiente x de Kendall 

Este coeficiente mide la correlación entre órdenes, como el de Spearman. 
Mide la correlación entre dos variables ordinales X e Y. Su expresión es: 

t-2S/N(N-1) 


El valor del coeficiente oscila entre menos uno y uno. En esta expresión N 
es la longitud de las series que se relacionan, X e Y. S es un sumatorio, cuyo 
cálculo se expone a continuación. 

Se ordenan los datos de una de las series X o Y. Cada elemento de la serie no 
ordenada se compara con los que le siguen. Si es mayor se suma una unidad. Si 
es menor se resta una unidad. La suma final es S, ésta se multiplica por dos y 
se divide entre N(N-l), siendo N el tamaño de la muestra. Por ejemplo: 


Sean las series 
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La serie X mide la importaneia que dan al diseño de una nevera 12 personas. 
La Y mide la importaneia que dan a la duraeión de la nevera esas mismas 
personas. Estos datos de orden proeeden de puntuaeiones que han dado a estas 
earaeteristieas del eleetrodoméstieo, por ejemplo de 1 a 100. La serie X 
apareee ordenada. Y muestra el eorrespondiente valor para eada par (x,y). 

Para ealeular S nos fijaremos en la serie Y. El primer término es inferior a 
todos los que le siguen, que son 11. Sumaremos 11 puntos. El segundo término 
es 5. Es inferior a 7 valores que le siguen, pero superior a tres. Sumaremos 7 y 
restaremos 3. El siguiente término de la serie es 2. Es inferior a los 9 términos 
que le siguen. Sumaremos 9. Proeediendo de la misma forma para toda la serie 
y sumando o restando, se eoneluye que S ^ 44. Aplieando la fórmula del 
eoefieiente tau, se eoneluye que su valor es: 

1-2-44/(12 (12-1))-0,67 


Esto signifiea que la eorrelaeión entre la importaneia del diseño y la 
duraeión de las neveras buseados por los eonsumidores es 0,67. 

Este eoefieiente es pareeido al de Spearman, pero no se puede eomparar eon 
él. Tiende a tomar un valor más bajo. En el disquete eneontrará dos series TI y 
T2, la primera ordenada, que se eorresponden eon la X e Y de este ejemplo. 

8.7.3.3. El coeficiente de concordancia W de Kendall 

Es una medida de relaeión entre varias variables ordinales. Esta medida 
sirve para eneontrar el grado de aeuerdo -eoneordaneia- entre unos jueees que 
valoran unos sujetos. Esos jueees pueden ser personas que valoran los 
atributos de produetos, profesores que estableeen un orden de brillantez de sus 
estudiantes, eteétera. 

Se parte de una tabla en la que figuran los rangos que unos jueees (en filas) 
estableeen para unos sujetos (personas, objetos, ete.). Por ejemplo, la tabla que 
viene a eontinuaeión muestra el orden de preferencias que tres jueces: Ana, 
Juan y Maria, establecen para seis tipos de envase de un refresco. 
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El coeficiente de concordancia mide con qué grado de acuerdo establecen 
los jueces su jerarquía, que puede variar entre cero y uno. 

La expresión de W cuando es: 

t^image 

que toma valores comprendidos entre cero y uno. 

Donde 


• Rj es el rango medio de cada sujeto o envase: 2,67 la botella de 
cristal; 4,67 el brick de litro, etc. 

• R es el rango medio del conjunto; vale 3,5 

• N es el número de sujetos o envases, 6. 

Según los datos, W = 0,16. Esto significa que el grado de acuerdo al 
jerarquizar los envases es muy bajo. Cuando el tamaño de las muestras es N>7 
se calcula el estadístico y su grado de significación. 


8.8. OTROS TESTS NO 
PARAMÉTRICOS 


Además de los tests expuestos en apartados anteriores, existen otras 
medidas de asociación y tests para contrastar hipótesis (Siegel y Castellaa, 
1989; Ruiz Maya et al., 1995). 


8.8.1. Análisis de la varianza por rangos con un factor 
controlado: El test de Kruskal-Wallis 


Este test es muy útil para deeidir si k muestras independientes, que no 
tienen forzosamente la misma dimensión, proeeden de distintas poblaeiones. 
La hipótesis nula que se formula es 

Hj) ^ {las medias de los grupos son iguales entre sí ]. 


Veamos un ejemplo. Se han tomado tres muestras (k^3) de desigual tamaño, 
llamadas I, II, y III. En total son 12 personas. 

Estos grupos I, II y III proporeionan un orden para un objeto, eonsiderados 
eomo una misma serie suma de I, II y III. Es deeir, doee personas 
proporeionan una puntuaeión a un objeto, que puede ser un envase, una 
anuneio, o un produeto. Esas puntuaeiones se eonvierten en datos de orden, 
dando un uno a la más baja (siempre) y 12 (en este easo) a la más alta, pues 
son doee personas. Después se vuelven a reeonstruir las muestras. Asi, I 
eontiene a tres personas, que han dado la mayor puntuaeión, 12, la más baja, 1, 
y la euarta empezando por la más baja. 

En la muestra II se eneuentran las personas que ha dado la segunda 
puntuaeión más alta por arriba (11) y por abajo (2). La eomponen 4 personas. 


1 

II 

III 

12 

2 

7 

4 

5 

10 

1 

3 

8 


11 

6 



9 


Posteriormente se ealeula la media de los rangos de eada muestra, que son 
para I, II y III, respeetivamente; 5,67; 5,25 y 8. Si las tres muestras no 
presentaran difereneias signifieativas, el rango medio será aproximadamente 
el mismo en las tres. Las pequeñas difereneias serian debidas al azar. Si los 
rangos se difereneian bastante, quiere deeir que las muestras son 
signifieativamente diferentes, o que no provienen de una misma poblaeión. 
Para apliear este test debe ealeularse el estadistieo 










Donde 
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• k es el número de grupos o muestras (3 en el ejemplo) 

• nj es el número de casos en las muestra j. No tienen por qué ser 
iguales. En el ejemplo I tiene tres casos, II tiene 4 y III, 5. 

• N es la suma total de casos (12 en el ejemplo). 

• Rj es la media de cada una de las k muestras (5,67; 5,25 y 8 en el 
ejemplo). 

El estadístico KW se distribuye como una con k-1 grados de libertad, 
siendo k el número de muestras. En este ejemplo k-1 es dos. 

La hipótesis nula que se formula es 

Ho = {no existen difereneias de medias] 


[(12 X Uj Rj2)/N(N+1)]-3(N+1) = [12(3 • 5,672 + 4 . 5^252 + 5 • 
82)/(12(12+1)] 3(12+1)- 1,51. 

El estadístico X2 con dos grados de libertad al 1% es 5; es mucho mayor que 
1,51. No se puede rechazar la hipótesis nula. No existen diferencias de medias 
entre las muestras, o dicho de otra forma, las muestras proceden de una misma 
población. 


8.8.2. Análisis de la varianza por rangos con dos 
factores controlados. Test de Friedman 

Cuando los datos de k muestras relacionadas proporcionan información en 
una escala ordinal, el test de Friedman se emplea para probar la hipótesis nula 
de que las k muestras proceden de una misma población. 

Por ejemplo, se podría comprobar el efecto de unos métodos de enseñanza 
con muestras aleatorias de niños. Esos métodos se podrian llamar A, B, C y D. 



Los grupos de niños serían I, II, III y IV. 


La hipótesis nula es 


[no existen diferencias de medias) 


Es deeir, la hipótesis nula supone que todas las medias son iguales entre las 
muestras. La tabla siguiente muestra las puntuaeiones dadas por 4 grupos 
(muestras aleatorias) a 3 objetos (métodos de enseñanza, envases, ete.): 

Klimage 

A partir de la tabla de puntuaeiones se elabora otra ordinal para eada una de 
las filas. Para ello se dará el valor uno a la puntuaeión más baja; dos a la 
siguiente superior, y así sueesivamente. 
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A partir de la tabla ordinal se estima el estadístico Fr. 
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donde N ^ número de filas u objetos 

número de columnas (variables o condiciones) 

Rj ^ suma de los rangos de la j columna 

Este estadístico se distribuye como una con k-1 grados de libertad 
siempre que K y N no sean demasiado pequeños. De acuerdo con los datos que 
estamos empleando ^ 7,4; que es menor que X^ al 5% ^ 7,8. Para este nivel 
de significación no puede rechazarse la hipótesis nula: 

Ho = {no existen diferencias de medias) 


es decir, los métodos de enseñanza no suponen rendimientos diferentes. 


8.8.3. Test de Cochran 

Se aplica a una muestra en distintos momentos del tiempo, con objeto de 
verificar si se han producido cambios de respuesta. 




Por ejemplo, una misma muestra de personas puede responder a un 
cuestionario en tres momentos del tiempo a tres entrevistadores distintos, o 
unas personas pueden ser sometidas a tratamientos médicos diferentes. El test 
se aplica con variables dicotómicas. Debe estimarse la siguiente expresión: 
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Veamos un ejemplo. Sea una muestra de 18 personas entrevistadas por los 
entrevistadores El, E2 y E3. Las respuestas dadas por cada una de esas 
personas a una pregunta pueden ser si ^ 1 y no ^ 0. 
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De acuerdo con los datos (k es el número de grupos o de veces que se recoge 
la información de la muestra; 3 en este caso, porque tres han sido los 
encuestadores) el valor de Q es: 


Q - (3-1)[3(132+ 13^+ 3^) - 29] / 3 • 29 - 63 - 16,7 


El test de Cochran permite conocer si los entrevistadores influyen en las 
respuestas. En principio se formula la hipótesis nula: 

Hq ^ {los entrevistadores no influyen sobre las respuestas]. 


El estadístico Q se distribuye como una Chi-cuadrado con k-1 grados de 
libertad, dos en el ejemplo, que toma un valor en tablas de 13,82 para un nivel 
de significación del 0,001. Como Q es mayor que 13,82 se rechaza la hipótesis 
nula, y se concluye que los entrevistadores si influyen en las respuestas de las 
personas. Obsérvese que este test es muy interesante para medir errores 
aleatorios en las escalas, siempre que sean dicotómicas. 

El test se puede aplicar siempre que el tamaño de la muestra N>4 y que 
Nk>24. Las preguntas no deben ser muy sencillas y debe transcurrir un tiempo 
prudencial entre los momentos en que se recoge la información. En este 
ejemplo N ^ 18 y Nk ^ 54. 


8.8.4. Test de McNemar 




Este test es muy útil para medir las difereneias entre un antes y un después. 
Se apliea a personas de una misma muestra sometidas a algún tratamiento. 

Por ejemplo, después de probar un produeto, de ver algún anuneio, o tras 
una eampaña politiea, algunas personas pueden eambiar de opinión. El test de 
MeNemar es muy seneillo de apliear. Se dispone de un euadro de doble 
entrada eomo el siguiente: 



— 

+ 

+ 

A 

B 

— 

C 

D 


Los valores A, B, C y D son freeueneias. A y D son el número de personas 
que eambian. Por eso los signos + y - difieren. B y C son freeueneias de 
personas que no eambian. Por eso mantienen sus signos. Los signos positivos y 
negativos no indiean nada bueno ni malo. Sólo son eódigos para deteetar un 
eambio. 

A partir de esas freeueneias se estima el estadistieo eomo se indiea: 

X2 - (|A-D| -1 )2 / (A + D) 

Por ejemplo, una muestra de 75 personas ha probado un produeto que no 
habla eonsumido antes. La tabla que apareee a eontinuaeión quiere deeir que 
antes de esa prueba 13 eran hostiles y después no; 7 eran no hostiles y tras la 
prueba se eonvierten en hostiles; 27 eran y siguen siendo no hostiles y 28 eran 
y siguen siendo hostiles. 



No hostiles 

Hostiles 

Hostiles 

13 

28 

No hostiles 

27 

7 


La hipótesis nula es {laprueba no eambia la aetitud ). 


Para saber si la prueba ha supuesto eambios se ealeula 





X2 = (13-7 -1)2 / (13 + 7) = 1,25 


Si el estadístico (1,25) supera el valor en tablas con 1 grado de libertad, se 
rechazará la hipótesis nula. con 1 grado de libertad al 0,05 vale 3,84. En 
consecuencia, no se puede rechazar la hipótesis nula: la prueba del producto no 
supone que cambien las actitudes. Para aplicar el test de McNemar A + D tiene 
que sumar 10 como mínimo. 


8.8.5. Tablas de contingencia 2x2 

Una de las aplicaciones más útiles del contraste chi-cuadrado es probar si un 
conjunto de frecuencias que aparecen en una tabla 2x2 son independientes. 
Para ello se parte de una tabla como la siguiente, en la que x, e y denotan una 
característica excluyente; fumar o no fumar; w y z muestran otras 
características también excluyentes; beber alcohol o no beberlo. 

Klimage 

A partir de esta tabla se calcula el estadístico 

X2 = N (|AD-BC| - N/2)2 / (A+B)(C+D)(A+C)(B+D), con 1 grado de 
libertad, se formula la hipótesis nula y se rechaza o no. 

Veamos un ejemplo. La tabla siguiente muestra la distribución de 
frecuencias conjuntas entre fumar-no fumar y beber-no beber. 

Kimage 

El estadístico X^ ^ 7,33 con (2-1) • (2-1) grados de libertad. El valor en 
tablas para un nivel de significación del 1% es 5,88. 

La hipótesis nula es ^ {no existe relación entre fumar y beber], 

es decir, ambas conductas son independientes. 

Como 7,33 es mayor que 5,88 se rechaza la hipótesis nula y se concluye que 
ambos hábitos está relacionados. 


8.8.6. Probabilidad exacta de Fisher 


Este test es muy útil para analizar datos diseretos, nominales u ordinales, 
euando dos muestras independientes son pequeñas. Se emplea euando la 
informaeión de dos muestras aleatorias se agrupa en dos elases mutuamente 
exeluyentes, que pueden ser un grupo experimental y otro de eontrol, hombres 
o mujeres, ete. La probabilidad exaeta de Fisher mide la probabilidad de que 
una hipótesis nula sea eierta. 

Por ejemplo, se puede reeoger informaeión de dos muestras, una de hombres 
(muestra I) y otra de mujeres (muestra II), sobre sus aetitudes ante la 
prohibieión de fumar en loeales públieos. X reeoge las aetitudes favorables e 
Y las no favorables a esta disposieión. 

t^image 

t^image 

En este ejemplo la hipótesis nula que se formula es 

Hj, = {el sexo no influye en la actitud). 

A eontinuaeión ha de ealeularse la probabilidad exaeta de Fisher: 
p-(A + B)! (C + D)! (A + C)! (B + D)! /N! A! B! C! D! - 0,0563 

Se eoneluye que la probabilidad de que sea eierta es 0,0563. 
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MULTIVARIANTE DE LA 
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(I).MÉTODOS DE 
DEPENDENCIA 


9.1. INTRODUCCIÓN. OBJETIVOS 
DEL CAPÍTULO 


En este eapítulo se estudian el análisis entre variables a través de 
métodos de dependeneia. Tras el estudio de este eapitulo el lector 
conocerá, 

• Qué es la regresión minimocuadrática y cuál es su utilidad. 

• Qué es el análisis conjunto y qué aplicaciones tiene en marketing. 

• Qué son modelos logit y para qué sirven. 

• Qué son las técnicas de segmentación y cuál es su utilidad en 
marketing. 

• Qué es el análisis discriminante y qué utilidad tiene. 






9.2. REGRESIÓN MÍNIMO 
CUADRÁTICA 


La relación que pudiera existir entre variables puede ser de dos clases; 
de dependencia e interdependencia. En la primera una de ellas se 
encuentra condicionada por otra u otras; por ejemplo, el consumo es 
función de la renta. Cuando existen relaciones de interdependencia todas 
las variables se encuentran asociadas, sin que ninguna dependa de las 
demás. Por ejemplo, cuando se define un perfil de consumidor es posible 
hacerlo destacando que se trata de un hombre, entre 35 y 50 años, casado, 
con ingresos superiores a 50.000 € al año y que vive en una capital de 
provincia. 

Entre de los métodos multivariantes la regresión es probablemente uno 
de los más conocidos, si bien gran parte de las personas desconocen sus 
orígenes, e incluso el porqué de su denominación. 

Como técnica se conoce desde principios del siglo XIX. Una de sus 
primeras aplicaciones la llevó a cabo un médico para demostrar que si una 
persona se aleja de la estatura media de su familia, sus descendientes 
tienden a «regresar a la media». Ese médico se llamaba Galton y la 
aplicación de esta técnica le dio su nombre: regresión. Ea regresión ha 
evolucionado lentamente. Desde sus orígenes hasta convertirse en una 
técnica desarrollada, sólida y fiable ha pasado casi siglo y medio. 

En la actualidad constituye un excelente método para cuantificar 
relaciones detectadas entre variables. Muchas magnitudes económicas 
parecen estar asociadas. Por ejemplo, las ventas y la publicidad, o la 
cantidad demandada y el precio de los productos. Ea utilidad de la 
regresión en marketing es considerable. Si una empresa llegara a conocer 
que un incremento de los precios o de su presupuesto publicitario, en un 
determinado porcentaje, se tradujera en un aumento de las ventas, habria 
encontrado un instrumento para alterar su cifra de negocio. Eas empresas 
también pueden emplear la regresión para hacer previsiones de demanda 



siempre que las condiciones del entorno permanezcan estables o modelizar 
el comportamiento de los consumidores en función de ciertas variables 
como la edad, el género, la renta o sus gustos. En la práctica, la regresión 
no debe emplearse para hacer previsiones, pero su utilidad para explicar el 
pasado reciente y las relaciones entre variables es considerable. 


9.2.1. Modelos lineales 

La regresión suele estudiarse en cursos de introducción a la estadística. 
Las demostraciones sobre cómo se obtienen los parámetros de los modelos 
o las medidas de fiabilidad no suelen ser muy atractivas. En la exposición 
de este apartado se muestra un ejemplo que servirá para recordar los 
fundamentos de la regresión, sin necesidad de acudir a fórmulas 
complicadas o a demostraciones interminables. De todas formas el lector 
interesado puede profundizar si lo desea en un texto de estadística o 
econometria. 

Los datos del ejemplo que se desarrollará son reales y corresponden a 
un estudio realizado en Estados Unidos a finales de los años 60. En el 
cuadro 9.1 aparecen la variables X, que mide el precio del gas natural en 
centavos de dólar e Y, su consumo per cápita, ambas magnitudes referidas 
a miles de pies cúbicos, en veinte ciudades de Estados Unidos 
(Makridakis, 1983). El consumo medio es Ym = 69 pies^ por habitante. 

Si una persona sólo conociera la relación de consumos por ciudades 
podría calcular la media, que es de 69 piesk Si no conociera el precio no 
podría hacer ninguna estimación del consumo de gas natural en ninguna 
ciudad. Si a un analista se le preguntara por el consumo per capita en 
cualquier ciudad americana sólo podría estimar que es de 69 pies^ por 
habitante. En ausencia de otra información la media es el único estimador 
que puede emplearse. 

El analista puede relacionar el consumo con alguna otra variable; por 
ejemplo, el precio. Tiene sentido hacerlo, pues el precio de los bienes es 
una variable que influye en el consumo. La teoría económica lo demuestra. 


Razonando de esta forma hemos llegado a formular un modelo causal: el 
consumo de gas depende de su precio. Puede proponerse que a medida que 
aumente el precio del gas menos cantidad se consumirá. Si el precio bajara 
su consumo aumentaria. Esta relación puede escribirse asi 

Y= a + PX 


Donde: 

Y es la cantidad demandada de gas natural, su consumo. 

X es el precio del gas. 

a, y P son dos parámetro que han de estimarse. 

El gráfico 9.1 muestra una nube de puntos de combinaciones de pares de 
valores cantidad/precio. Ea recta descendente recoge la tendencia de la 
cantidad consumida del gas a medida que desciende el precio. Desde 
luego, las mejores asociaciones aparecen recogidas en cada punto de la 
nube, pero interesa llegar a formular un modelo que explique lo mejor 
posible esa relación entre precio y cantidad. 

Gráfico 9.1 


CANTIDAD 



PRECIO 







Estimar la recta de regresión de Y en función de X consiste en obtener 
las estimaciones a Y (^- El criterio minimo cuadrático consiste en 
minimizar la suma de los cuadrados de los errores, siendo los errores 
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Se denomina recta de regresión muestra! de Y sobre X a 


Es decir, la esencia de la regresión está en encontrar una recta que pase 
lo más cerca posible de todos los puntos de la nube. No puede pasar por 
todos ellos, lógicamente. Una forma de medir la bondad del ajuste es la 
suma de los cuadrados de las diferencias entre los valores reales de la 
variable explicada y los previstos por el modelo. El mejor modelo es aquel 
que minimiza la suma de los cuadrados de las diferencias o errores. 

A partir de los datos de cantidades y precios que aparecen en el cuadro 
9.1 se pueden estimar el modelo de regresión. 




Cuadro 9.1 


Precio 

Cantidad 

Predicción 

Error 

Predicción por intervalo 
de confianza 95% 

30,00 

134,00 

105,43673 

28,56327 

58,39754 

152,47591 

31,00 

112,00 

104,33258 

7,66742 

57,41795 

151,24721 

37,00 

136,00 

97,70772 

38,29228 

51,46564 

143,94981 

42,00 

109,00 

92,18701 

16,81299 

46,40467 

137,96935 

43,00 

105,00 

91,08286 

13,91714 

45,38121 

136,78452 

45,00 

87,00 

88,87458 

-1,87458 

43,32286 

134,42630 

50,00 

56,00 

83,35386 

-27,35386 

38,10948 

128,59824 

54,00 

43,00 

78,93729 

-35,93729 

33,86833 

124,00625 

54,00 

77,00 

78,93729 

-1,93729 

33,86833 

124,00625 

57,00 

35,00 

75,62486 

-40,62486 

30,64587 

120,60385 

58,00 

65,00 

74,52072 

-9,52072 

29,56375 

119,47768 

58,00 

56,00 

74,52072 

-18,52072 

29,56375 

119,47768 

60,00 

58,00 

72,31243 

-14,31243 

27,38751 

117,23735 

73,00 

55,00 

57,95857 

-2,95857 

12,85168 

103,06546 

88,00 

49,00 

41,39642 

7,60358 

-4,74628 

87,53912 

89,00 

39,00 

40,29228 

-1,29228 

-5,94981 

86,53436 

92,00 

36,00 

36,97985 

-.97985 

-9,58233 

83,54202 

97,00 

46,00 

31,45913 

14,54087 

-15,70809 

78,62635 

100,00 

40,00 

28,14670 

11,85330 

-19,42529 

75,71869 

102,00 

42,00 

25,93841 

16,06159 

-21,92033 

73,79716 


El modelo que se estima eon esos datos es 

Y= 138,561 - 1,104 X 

Para conoeer el poder explicativo del modelo se calcula el coeficiente 
R^, que este caso vale 62,4% o bien 0,624. Este valor significa que el 
precio explica el 62,4% de las variaciones de la cantidad. Ciertamente, el 
modelo no es muy explicativo. En la práctica no deberian aceptarse 
modelos con inferiores a 0,9, por lo menos. 

Una vez obtenido basta con sustituir en él los valores del precio para 
hacer estimaciones. Ea columna predicción contiene los consumos que 






























estima el modelo para cada precio considerado X, que se pueden comparar 
con los consumos reales que figuran en la columna 2. Obsérvese que las 
previsiones del modelo son muy parecidas a los valores reales para 
precios de 45, 73 y 92. En bastantes casos lo real y lo que prevé el modelo 
difiere mucho, por ejemplo, para el primer precio, de 30. La columna error 
muestra los errores de estimación del modelo. Es la diferencia entre la 
previsión para cada precio y el valor real. La columna Predicción por 
intervalo de confianza al 95% muestra el intervalo dentro del cual se 
mueve la predicción de consumo para cada precio con una confianza del 
95%. 


En un modelo de regresión se pueden incluir variables que pueden ser 
explicativas, o no. Para saberlo es necesario hacer un contraste de 
hipótesis para medir el grado de significación de los coeficientes de las 
variables, muy simple. Se propone contrastar la hipótesis nula de que el 
coeficiente no difiere de alguna magnitud, o valor de contraste, y se 
calcula un estadístico t como se indica. La hipótesis nula es Ho = el 
coeficiente no difiere significativamente de un valor a contrastar 

Bajo la hipótesis nula este estadístico se distribuye como una 
distribución t de Student con n-2 grados de libertad. Para un nivel de 
significación a se rechaza la hipótesis nula si |t|>t(jj /2 de Student. En la 
práctica se suele tomar a = 0,05 que proporciona t = 2, aproximadamente, 
en valor absoluto. Es decir si t de los coeficientes en valor absoluto vale 
más que dos se rechaza la hipótesis de nula. En este caso el valor t de (3 es 
-5,467. En consecuencia, el coeficiente difiere de cero. 


9.2.2. Modelos no lineales 

En el ejemplo anterior se ha supuesto que el modelo que relaciona la 
cantidad consumida con el precio es lineal. Sin embargo no tiene por qué 
ser forzosamente asi. El posible especificar modelos del tipo, 

Y=aX-P 



La forma de operar eon ellos es similar a la de los modelos lineales. El 
único paso que debe darse previamente es convertir el modelo en lineal. 
Para ello basta tomar logaritmos en los valores de las variables. 

Log Y= log a - (3 log X 

Si en lugar de trabajar con los valores de Y X se opera con sus 
logaritmos y se resuelve el sistema de ecuaciones que proporciona los 
valores de los coeficientes, se estiman log a y (3. Para estimar a se calcula 
el antilogaritmo de log a. 

En concreto, con los datos del ejemplo el modelo estimado es 

Y= 3634,914 X 

El coeficiente se incrementa sensiblemente, hasta 0,735 y los 
coeficientes de las variables siguen siendo significativos. En general los 
modelos exponenciales tienen las siguientes caracteristicas. 

• Proporcionan una calidad de ajuste igual o superior a los modelos 
lineales. Siempre que en los datos no aparezcan valores nulos o 
negativos es aconsejable emplear modelos no lineales. 

• Eos exponentes de las variables miden cómo reacciona la variable 
dependiente ante modificaciones de la/s independiente/s, es decir, 
esos exponentes miden elasticidades 

• Eas elasticidades que proporcionan son constantes, a diferencia de lo 
que sucede con los modelos lineales, cuyas elasticidades varian para 
cada combinación de variables. En el ejemplo expuesto la elasticidad 
de la demanda ante el precio es 0,998 en el modelo multiplicativo. 
En el lineal, para un precio de 30 es l,104x(30/105,44) = 0,31 y cada 
combinación precio-cantidad prevista por el modelo proporciona una 
elasticidad diferente. 



9.2.3. Algunos problemas: causalidad, 
heterocedasticidad y colinealidad 


En la práctica la utilización de modelos de regresión no está exenta de 
dificultades o peligros. 

• Los modelos de regresión no son modelos causales. Los modelos 
cuantifican relaeiones entre las variables que los analistas 
seleccionan. Es posible que los analistas se equivoquen. Entonces los 
modelos no tendrán sentido porque asocian variables que no guardan 
relación. 

Veamos un ejemplo. Supongamos que se dispone de información sobre 
el número de niños nacidos en una serie de provincias y el censo de 
cigüeñas en ellas realizado por un grupo ecologista a lo largo del tiempo 
(en la práctica el número de pares de observaciones deberia ser mucho 
más amplio). 


Cuadro 9.2 


Nacimientos 

N.° de Cigüeñas 

1.200 

500 

1.380 

600 

1.620 

700 

1.800 

800 

2.010 

900 

2.200 

1.000 


Un analista podria formular la siguiente hipótesis: las cigüeñas traen a 
los niños. Podria emplear un modelo de regresión para «demostrarlo». Con 
estos datos el modelo lineal que se puede estimar es el siguiente. 


N= 186,66+ 2,02 C 



















(7,1) (59,2) 
R2 = 0,999 


El modelo es altamente «explicativo» pues el coeficiente de 
determinación es casi la unidad. Los valores de los estadísticos (entre 
paréntesis) t de los coeficientes son mucho mayores que dos, lo que los 
convierte en significativamente distintos de cero. 

El analista habría «demostrado» asi su hipótesis: los niños los traen las 
cigüeñas, pues el ajuste del modelo es casi perfecto. Como el coeficiente 
es 2,02 podría añadir que además cada cigüeña viene con dos niños y un 
poco más, ¿tal vez gemelos? ... 

Sin embargo esa hipótesis es falsa, y todo el mundo lo sabe. Además el 
analista no podría explicar cómo nacen 186,66 niños cuando el número de 
cigüeñas sea cero, al sustituir este valor el modelo. En ausencia de estas 
aves nacen, milagrosamente, 186,66 niños solos, puesto que si los niños 
son traídos por las cigüeñas y éstas no vienen ... se plantearla una 
conclusión incongruente, pues el modelo es inconsistente consigo mismo. 

En este ejemplo se ha puesto de relieve que los modelos de regresión 
cuantifican las relaciones que los analistas deben formular sensatamente. 
Antes de construir un modelo es necesario proceder a un análisis causal 
que encuentre relaciones causa efecto. Esas relaciones se pueden encontrar 
porque, 

• Otras ciencias las han formulado. Por ejemplo, tiene sentido asociar 
el precio de los bienes o la renta de las personas con la cantidad 
demandada porque la Teoria Económica asi lo demuestra. El modelo 
de regresión cuantifica una relación que admite una demostración o 
deducción formal. 

• La experiencia del analista, su intuición o la situación del momento 
aconsejan la modelización. Por ejemplo, es razonable pensar que una 
elevación en los gastos de promoción tenga un impacto positivo 
sobre las ventas. No existe una teoria que lo respalde ni ninguna 



demostración formal. Pero el sentido común puede invitar a un 
analista a construir un modelo de regresión que asocie las 
variaciones en las ventas a los gastos de promoción. 

La heterocedasticidad es una perturbación bastante frecuente. 
Técnicamente aparece cuando la varianza de los errores no es 
constante. Gráficamente se aprecia asi, 



La heterocedasticidad aparece con mucha frecuencia en el mundo 
económico. Por ejemplo, en una regresión entre el tamaño de las empresas 
y su volumen de beneficios habrá grandes empresas con beneficios muy 
altos, pero otras pueden tener también pérdidas altas. 

La heterocedasticidad suele deberse al empleo de muestras en las que 
aparecen asimetrías importantes en los valores de las variables, porque 
toman valores anormalmente altos o bajos respecto a la media. Ilustremos 
estas ideas con un ejemplo. 

Supongamos que se ha medido la fuerza de unos monos y que la 
relacionamos con su altura. La fuerza se mide en Kg. de peso que pueden 
levantar y la altura en centímetros. 


Cuadro 9.3 










Fuerza (Y) 

Altura (X) 

Dummy 

180 

85 

0 

130 

90 

0 

150 

95 

0 

145 

100 

0 

160 

110 

0 

10.000 

500 

1 


La regresión proporeiona el siguiente modelo 

Y = -2175,97 +24,30 X 
(-15) (37,8) 

R2 = 0,997 

Aparentemente los resultados son buenos y el poder explieativo del 
modelo muy satisfactorio. Parece que se puede concluir que la fuerza de 
un mono es función de su altura, de su corpulencia, en definitiva. 

El lector habrá apreciado que aparece un mono que mide cinco metros y 
levanta 10.000 Kg. El es el causante de la heterocedasticidad. Si se le 
elimina de la regresión el modelo deja de ser explicativo. En concreto, con 
las cinco primeras observaciones el modelo obtenido es, 

Y= 176,35-0,243 X 

( 1 , 6 ) (- 0 , 22 ) 

R2 = 0,016 

Sin embargo, no deben «elegirse» las muestras. El mono corpulento de 
este ejemplo no debe ser eliminado del estudio. El efecto de observaciones 
extremas como la de este King Kong se puede recoger con unas variables 
especiales que se llaman dummy o ficticias. 

























Estas variables son binarias. Se asoeian a observaeiones o fenómenos 
con unos y ceros. Unos cuando aparecen y ceros cuando no aparecen. En 
los datos que acaban de exponerse aparece una tercera columna 
encabezada por la palabra dummy. Eos monos «normales» tienen asociado 
un cero. King Kong un uno, para resaltar que se trata de un mono de 
características excepcionales. 

A continuación se muestra el modelo de regresión que recoge el efecto 
«King Kong». 


Y= 176,43 - 0,244 X + 9945 D 
(1,65) (-0,22) (22,24) 

R2 = 0,99998 

Obsérvese que es muy alto y similar al obtenido con el modelo que 
incluía todos lo monos sin distinciones. Sin embargo sólo la variable D, la 
ficticia que diferencia a King Kong del resto es significativa. Ea altura de 
los monos no explica su fuerza; su estadístico t es menor que dos. Se 
concluye que la única relación entre fuerza y altura que aparece clara es la 
de King Kong. 

El empleo de variables ficticias permite eliminar los efectos de la 
heterocedasticidad. Sin embargo, cuando aparecen observaciones que se 
alejan mucho de la media y que pueden distorsionar los modelos no deben 
emplearse, salvo que pueda identificarse esas situaciones y justificar su 
empleo. 

• La colínealídad aparece cuando en los modelos de regresión dos o 
más variables explicativas están correlacionadas. 

Esa correlación de variables puede aparecer por causas diversas. Una de 
ellas puede ser, simplemente, el azar. Otras veces existen razones 
económicas. Por ejemplo, en una empresa el precio de un producto puede 
estar muy influido por la publicidad. Un modelo que asocie las ventas con 
el precio y a la publicidad se encontrará con problemas de colinealidad. 



Supongamos que una empresa fija un precio que es doble del gasto 
unitario en publicidad, para absorber otros costes de estructura. A 
continuación se muestran las ventas en unidades fisicas, el gasto 
publicitario y el precio de un producto medidos en pesetas, con objeto de 
estimar un modelo de regresión. 


Cuadro 9.4 


Ventas 

Publicidad 

Precio 

630 

100 

200 

600 

110 

220 

550 

120 

240 

520 

130 

250 


El ajuste del modelo es, 

V= 1033,37 - 2,665 Publicidad - 0,666 Precio 
(16,16) (-1,037) (-0,445) 

R2= 0,984 

La colinealidad se detecta muy fácilmente: el suele ser muy alto, 
pero los estadísticos t toman un valor muy bajo, que hace que no pueda 
rechazarse la hipótesis de nulidad de los coeficientes. Cuando la 
correlación entre las variables explicativas es perfecta los programas de 
ordenador se interrumpen («cascan», en argot informático). Para ilustrar 
este ejemplo todos los precios son el doble del gasto unitario publicitario 
excepto el último, para poder encontrar una solución que ilustrara las ideas 
expuestas. Cuando aparece colinealidad no hay nada que hacer, salvo 
eliminar alguna de las variables explicativas o tomar otra muestra de 
datos. 


9.3. ANÁLISIS CONJUNTO (AC) 




















9.3.1. Concepto 


Es una familia de métodos multivariantes explicativos. Miden el efecto 
conjunto de varias variables independientes (explicativas), generalmente 
nominales, sobre el orden o preferencia de la variable explicada, que 
puede ser ordinal o métrica. 

Se basan conceptualmente en que el consumidor debe elegir entre varias 
opciones imperfectas y la decisión final obliga a un compromiso: el 
sacrificio de algunas cualidades del producto para la obtención de otras 
caracteristicas más deseadas. No puede esperar que le se ofrezca un 
producto «bueno, bonito y barato». Si desea un producto no puede esperar 
que tenga todos los atributos en grado máximo. Un coche puede ser 
potente, bien terminado, caro y con consumo elevado. Otro puede ser 
barato, de consumo reducido, pero mal terminado. Las opciones son, 
generalmente, imperfectas. 

El AC mide la importancia relativa o utilidad de cada uno de los 
atributos que caracterizan un producto y determina su combinación 
preferida, asi como la participación de cada atributo en la valoración total 
del producto. 

Su principal aplicación en marketing es que proporciona información 
cuantitativa sobre el sistema de valores que tiene un decisor a partir de una 
ordenación de preferencias sobre productos alternativos con distintos 
niveles de atributos. 


9.3.2. Una aplicación del AC al diseño de un 
producto 

Los estudios de este tipo comienzan seleccionando el conjunto de 
atributos que puede tener el producto y los niveles posibles (o gradaciones 
de los atributos). Por ejemplo, para un producto bancario, una nueva 
cuenta corriente podria tener: 



• Tipo de interés: 3%, 4%, 5%, representados por los niveles 0, 1 y 2. 

• Incorporación de un seguro de vida gratis: no, sí, que son los niveles 
Oy 1. 

• Cuantía de las comisiones: no, bajo precio y alto precio, que son los 
niveles 0, 1 y 2. 

• Tarjeta de crédito gratis: no, sí, o niveles 0 y 1. 

Con estos atributos se pueden formar 3x2x3x2 = 36 posibles 
combinaciones o conceptos. 

En un estudio con una muestra a cada encuestado se le presentan estas 
combinaciones (o una selección de ellas) y se le pide (a través de 
diferentes procedimientos) que ordene las combinaciones por orden de 
preferencia o que asigne una puntuación conforme a una escala métrica. 

Como los treintaiseis posibles conceptos son excesivos y las personas 
encuestadas no sería capaces de expresar sus preferencias correctamente, 
ante tantas combinaciones de atributos, se elige un subconjunto formado 
por nueve de ellas, de manera que permita estudiar los efectos principales 
obteniendo los mismos resultados que con el conjunto de los treintaiseis. 
La elección que cumple esta propiedad se llama plan factorial incompleto. 
Algunos programas de ordenador los proporcionan, como el SPSS+. 

En el cuadro 9.5 se describen los nueve conceptos (representativos de 
los treintaiseis) según el nivel que tienen en cada atributo. La primera 
columna representa el tipo de interés; la segunda el seguro; la tercera el 
cobro de comisiones y la cuarta la tarjeta de crédito. La última columna 
indica el orden de preferencias de una persona. 


Cuadro 9.5 


0 

0 

0 

0 

6 

0 

1 

1 

0 

4 

0 

1 

2 

1 

3 

1 

1 

0 

1 

8 

1 

1 

1 

0 

5 

1 

0 

2 

0 

1 

2 

1 

0 

0 

9 

2 

0 

1 

1 

7 

2 

1 

2 

0 

2 


El primer concepto (0 0 0 0) tiene todos los niveles de atributo cero: es 
una cuenta corriente con un 3% de interés, no incorpora seguro de vida 
gratis, no cobra comisiones y no proporciona tarjeta de crédito gratis. 

Al consumidor se le presentan los conceptos a través de descripciones 
verbales (escritas) y/o gráficas, citando sus atributos. Generalmente se 
representa cada uno en un cartón o una tarjeta y se le pide que las ordene 
según sus preferencias. En esta caso, el 9 de la columna 5 indica el 
preferido, 8 el siguiente y 1 es el menos apreciado. 

Eos métodos de análisis conjunto obtienen, para cada encuestado, unas 
funciones de utilidad parciales para cada uno de los niveles de los 
atributos. Estas utilidades son tales, que al calcular la de un concepto 
como suma de las utilidades de cada uno de los niveles de los atributos 
que lo componen, las utilidades de los conceptos guardan el mismo orden 
que las preferencias expresadas por el consumidor. 

El análisis proporciona, 

- Ea importancia de cada caracteristica o factor. 

- Ea utilidad que le atribuye el consumidor a cada uno de los niveles de 
los atributos. 

Eos resultados del ejemplo considerado para dos personas cuyos 
órdenes de preferencias son los siguientes. 


643851972 



634581972 


aparecen a continuación. 


Tabla 9.6. Utilidades por niveles 


Interés- 

Seguro 

Comisiones- 

Tarjeta — 









r 1 


1 0,00 0,33 1,67 0,00 0,50 5,67 3,33 0,00 0,00 1,50 

RSQ= 0,97222 

2 0,00 0.33 1,67 0,00 0,50 5,33 2,67 0,00 0,00 2,00 

RSQ= 0,93056 


Tabla 9.7. Utilidades medias 


Niveles 

1 

2 

3 

Interés 

3% 

4% 

5% 

Import. %: 17,70 

0,00 

0,33 

1,67 

Seguros 

No seguro 

SI seguro 


Import. %: 5,31 

0,00 

0,50 


Comisiones 

No comisión 

Baja comisión 

Alta comisión 

Import. %: 58.41 

5,50 

3,00 

0,00 

Tarjeta 

No tarjeta 

Sí tarjeta 


Import. %: 18,58 

0,00 

1,75 



El cuadro 9.6 representa las utilidades de cada nivel para cada una de las 
personas consideradas y un indice de la calidad del ajuste RSQ 
(equivalente al coeficiente de determinación) comprendido entre cero y 
uno, valores máximo y mínimo que puede tomar. En ambos casos el ajuste 
es muy bueno pues RSQ es próximo a 1. 

Para ambos consumidores la característica más importante son las 
comisiones, y el nivel de mayor utilidad es que no haya comisión. Para la 
persona 1 es más importante (5,67) que para la segunda (5,33). 

























El cuadro 9.7 recoge las utilidades medias para el conjunto de personas 
(dos en este caso, pero podrían haber sido miles) y la importaneia relativa 
de eada característica en porcentaje. Se observa que la earaeteristica 
comisiones es la más importante de todas; 58,41% y el seguro de vida la 
menos interesante; 5,41%. 

Cuanto más altas sean las eomisiones que se cobran menor será la 
utilidad y, en consecuencia, el atraetivo que genera la cuenta. 

La hipótesis de base del modelo es que la utilidad total de un concepto o 
produeto es igual a la suma de las utilidades asoeiadas a cada uno de las 
modalidades de los atributos. A partir de aqui se puede medir la utilidad 
total que le proporeionan a un consumidor las distintas combinaciones o 
productos y «jugar» con distintas alternativas. 

El produeto más apreeiado será aquel que paga un 5 de interés, 
incorpora seguro de vida, no cobra comisiones y tiene tarjeta de erédito 
gratis: su utilidad total es de 9,42 puntos. 

Una cuenta cuyo atractivo sea que no eobra comisiones tiene una 
utilidad de 5,5. Ahora bien si se pretendiera cobrar comisiones bajas se 
pierden 2,5 puntos de utilidad, y para eompensarlo seria neeesario 
incorporar tarjeta gratis (utilidad 1,75), seguro de vida (utilidad 0,5) y 
pagar un interés del 4% (utilidad 0,33) o bien un interés del 5% (utilidad 
1,67) más tarjeta de crédito (utilidad 1,75). 

Si se cobraran comisiones altas se perderían 5,5 puntos de utilidad que 
no se pueden compensar con las demás características. 

Si este estudio se hiciera para una muestra de consumidores se podría 
elegir la eombinaeión o produeto más adeeuado para el mereado o para el 
segmento considerado. 

También es posible considerar cómo será valorado eon relación a ala 
competencia. Para ellos se tendrían en cuenta las utilidades de sus 
caraeteristieas. 


9.3.3. Aplicaciones 


El modelo presenta grandes posibilidades para la resolución de distintos 
aspectos del marketing. Además de permitir detectar los atributos claves 
del producto sirve para: 

• Medir la importancia de los atributos de los productos en sus sentido 
más amplio; precios, elasticidades de demanda, influencia de las 
marcas, diseños, colores, lugar de procedencia, denominaciones de 
origen, etc. 

• Evaluar nuevos conceptos de productos o servicios. Es posible 
evaluar nuevos conceptos sin formularlos expresamente, y en este 
sentido presenta dos ventajas frente a los métodos clásicos el coste 
de evaluación por concepto es bajo y la persona encuestada no 
necesita conocer explicitamente el objeto de la encuesta. 

• Cuantificar evaluaciones sensoriales. Por ejemplo, permite evaluar la 
utilidad en función del uso que se da al producto (por ejemplo bebida 
para la comida, o para tomar en cafeterias, etc.) y concretar la 
intensidad de atributos sensoriales, como color, olor, etc. 

• Simular el mercado. Para ello se calculan los sistemas de valores de 
los consumidores para los atributos determinantes del producto. Con 
éstos se pueden construir un modelo que describa las reacciones de 
los consumidores ante modificaciones en los atributos. 

• Realizar segmentaciones funcionales a partir de las utilidades que 
buscan los consumidores en el producto. Por ejemplo, podria 
detectarse un grupo de consumidores que valorar mucho el precio y 
menos la calidad. Otro podria mostrar una gran preferencia (utilidad 
por la calidad, sin que el precio elevado genere «desutilidad». Para el 
primer grupo se podrian fabricar productos baratos, aunque de 
calidad aceptable. Para el segundo, productos caros de gran calidad. 
Ea empresa podria actuar en el mercado con dos marcas. Una 



primera marca de gran prestigio y una segunda marca situada a un 
menor nivel. 


9.4. MODELOS LOGIT 


Desde hace varias décadas proliferan estudios empiricos sobre el 
comportamiento de los consumidores. Con estos análisis se pretende 
contrastar teorias, analizar factores causales o, simplemente, encontrar 
pautas de comportamiento para resolver situaciones concretas. 

Los consumidores no manifiestan comportamientos homogéneos. 
Muchos se encuentran asociados al género, la edad, la renta u otras 
caracteristicas de tipo sociográfico o psicográfico, es decir, relacionadas 
con diferentes estilos de vida. Las empresas crean bienes y servicios 
teniendo en cuenta esta diversidad de variables. Para aislar grupos de 
consumidores existen técnicas univariantes y multivariantes. Los contrates 
chi-cuadrado, los análisis de las varianzas, los planes factoriales y los 
métodos de jerarquización proporcionan una información esencialmente 
cualitativa, que permite encontrar tipologias de consumidores, pues se 
determinan perfiles que caracterizan a una serie de sujetos en términos 
excluyentes; si-no, verdadero-falso, compra-no compra. 

Los criterios que se emplean permiten hacer predicciones en términos 
cualitativos, es decir, se hacen previsiones de lo que parece más probable, 
pero no llegan a estimarse cuantitativamente las probabilidades de 
comportamiento. 

Es muy frecuente que en los cuestionarios figure un gran número de 
respuestas que sean de naturaleza cualitativa. Se compra un producto, o 
no. Se posee coche o no, etc. Estas variables se asocian con determinadas 
características de los consumidores y de esta forma se pueden identificar 
segmentos. 



La dicotomización de comportamientos permitirá proponer, por 
ejemplo, que dado un nivel de renta se posee coche. Si los ingresos fueran 
inferiores a esa frontera no se poseerá. Sin embargo, las cosas no son tan 
sencillas y la transición entre comprar y no comprar no es tan drástica. Es 
más razonable pensar que a medida que aumenta el nivel de renta de las 
personas se incrementa la probabilidad de que se compren un coche. Ganar 
el doble, por otra parte, no significa que se vayan a comprar dos coches. 
Sin embargo, se puede adivinar que existe una mayor probabilidad de 
comprarlo o, sencillamente, de optar por uno más caro. 

Cuando los ingresos son bajos, la probabilidad de comprar -un coche, 
por ejemplo- es baja y cuando son altos sucede todo lo contrario. Para 
rentas intermedias, la probabilidad de compra oscila alrededor de un 50%. 

Supongamos que la renta media de una determinada zona es de 12.000 € 
y que la desviación es de 1.000 €. Se puede proponer que cuando la renta 
de una persona sea de 15.000 € (m+3o) la probabilidad de comprar el 
coche será alta. Por el contrario, cuando la renta sea de 9.000 € (m-2o) 
dicha probabilidad será baja. 


Gráfico 9.3 



La función de distribución siempre tiene su ordenada, la probabilidad, 
comprendida entre cero y uno, y nuca decrece. Si se elige como modelo de 
comportamiento la función logistica su expresión es 


(|) = 1 / (1 + e 


eax/ (1 





esta función que proporciona probabilidades será creciente cuando ax > 0. 
El signo de ax lo proporcionan conjuntamente las estructuras de las 
variables explicativa (x) y su respuesta (y). Pero si el exponente toma la 
forma 


ax = P„ + P|X 


la probabilidad 


p = ^ /1 + c^’ * 


La estimación de los modelo logit se efectúa con programas 
estadísticos. Veamos un ejemplo. El cuadro 9.8 muestra el consumo diario 
de alcohol y tabaco medido en gramos y el número de personas que 
contraen y no contraen cáncer (Ruiz Maya et al. 1995, 592). 


Cuadro 9.8 


Gramos de 
alcohol 

Gramos de 
tabaco 

Contraen 

cáncer 

No contraen 
cáncer 

Total 

19.5 

4.5 

9 

252 

261 

19,5 

14,5 

10 

74 

84 

19,5 

24,5 

5 

37 

42 

19,5 

34,5 

5 

23 

28 

59,5 

4.5 

34 

145 

179 

59,5 

14,5 

17 

68 

85 

59,5 

24.5 

15 

47 

62 

59,5 

34,5 

9 

20 

29 

99,5 

4.5 

19 

42 

61 

99,5 

14,5 

19 

30 

49 

99,5 

24,5 

6 

10 

16 

99,5 

34,5 

7 

5 

12 

139,5 

4.5 

16 

8 

24 

139,5 

14,5 

12 

6 

18 

139,5 

24,5 

7 

5 

12 

139,5 

34,5 

10 

3 

13 


El modelo logit que cuantifica la probabilidad de contraer cáncer en 
función del consumo de tabaco y alcohol es: 


p.= 


I 

I + C * •' ’-* ** * 'I + 'J.U2KÍ »;) 












donde es el consumo de gramos de alcohol y X 2 el consumo de gramos 
de tabaco. Así, si una persona consumiera 59,5 gramos de alcohol y 24,5 
gramos de tabaco diarios, tendría 0,253 probabilidades de contraer cáncer. 

Los modelos logit son muy empleados en marketing porque permiten 
alcanzar diversos objetivos: 

• Encontrar tipologías de comportamiento; es decir, qué características 
tienen los consumidores, cuál es su perfil; edad, género, renta, 
hábitat, estructura familiar, etc. 

• Calcular las probabilidades de sus comportamientos en función de 
las características de los consumidores. 

• Conocida la magnitud de la población, el tamaño de un segmento 
identificado es la esperanza matemática resultado de multiplicar el 
tamaño del universo por la probabilidad de comportamiento. 

Los modernos sistemas de codificación comercial permiten vincular 
cada compra a los identificadores que se incluyen el tarjeta de crédito de 
los clientes. De esta forma los productos, o incluso las marcas, y las 
características de los consumidores se asocian. Pueden construirse 
modelos que relacionen la compra con la edad, el tamaño de la familia, la 
profesión, la edad, ciertas características psicográficas del consumidor, e 
incluso el momento de la compra -por la mañana o por la tarde, el día de 
la semana. Las empresas pueden de esta forma conocer al máximo el 
comportamiento del consumidor hasta llegar, incluso, a modelizar sus 
hábitos, de una forma mucho más sencilla y práctica que los complicados 
modelos de compra repetitiva, tan de moda durante los años 60 y 70. 


9.5. TÉCNICAS DE 
SEGMENTACIÓN 



En ocasiones interesa identifiear perfiles de comportamiento para 
eneontrar grupos de eonsumidores que tengan earacterístieas afines. Esta 
es la esencia de la segmentaeión de mercados. Para segmentar una muestra 
en función de un conjunto de variables se emplean las técnieas de 
segmentación, que resultan muy útiles, seneillas de apliear y de 
interpretar. 

Eas técnicas de segmentación consiguen la división de una población o 
muestra de la misma en grupos que poseen caraeterísticas afines 
empleando para ello un conjunto de variables que actúan como 
independientes. Es posible segmentar un comportamiento medido por 
variables cuantitativas o cualitativas. Eas variables independientes 
también pueden ser cuantitativas o cuantitativas. 


9.5.1. Regresión por árbol de decisión binario 

Ea segmentación mediante regresión por árbol de decisión binario se 
aplica cuando se trata de segmentar un comportamiento medido a través 
de una variable cuantitativa, al margen de la naturaleza de las variables 
explicativas. 

Para encontrar los segmentos los programas informáticos realizan 
eontrastes ehi-cuadrado o análisis de la varianza y dividen los grupos que 
encuentran entre otros dos, siempre que sean capaees de encontrar una 
variable o eriterio que permita dividir los grupos que van apareciendo. 
Cuando un segmento ya no se puede dividir, porque sean tan homogéneo 
que no existen variables que permitan su escisión, se obtiene lo que se 
denomina segmento final o terminal. 

El gráfico 9.4 muestra un árbol de segmentación del gasto en alimentos 
y bebidas no alcohólicas en España, estimado a partir de los datos de la 
Encuesta Continua de Presupuestos Familiares de 1998. El segmento 
inicial muestra que el gasto medio por hogar fue de 2.997 €. Este 
segmento se puede dividir en dos, según el tipo de hogar. Asi, los hogares 
Nido Eleno I, II y III (con hijos pequeños, adolescentes y mayores) gastan 


más, 3.508 €, y suponen en 63,35% de los hogares. Por el contrario, las 
personas que viven solas, las parejas sin hijos, los hogares de la tercera 
edad gastan menos, 2113 € por hogar, y representan el 36,65% de los 
hogares. 

Los hogares con hijos se dividen en dos grupos, en función de sus 
ingresos. Los que ganan hasta 15.600 € gastan 3.000 € y suponen el 
37,03% de la población. Cuando se ganan más de 15.600 € el gasto se 
eleva a 4.100 € y este grupo de hogares supone el 26,33% del total. 

Gráfico 9.4. Alimentos y bebidas no alcohólicas 



Fuente: F.l;ibi)nición pn>pia. 

Fuente: Elaboración propia. 

El gráfico muestra el árbol de segmentación que puede llegar a 
construirse. No es posible dividir los segmentos que aparecen al final de 
cada rama. Son los segmentos finales o terminales. Obsérvese que en el 
comportamiento también influye la localización geográfica; zona este 
(Cataluña, Baleares, Comunidad Valenciana) de España, Noroeste 
(Asturias, Galicia, Cantabria), Centro (ambas Castillas y Extremadura), 
Madrid, Sur (Andalucia y Murcia), Canarias, Noreste (Pais Vasco, Rioja, 
Navarra, Aragón). 




Esta herramienta resulta extraordinariamente útil para la segmentación 
de mercados. El analista debe seleccionar la variable dependiente (gasto 
en alimentos) y las independientes, que son criterios o variables que se 
emplean habitualmente en segmentación de mercados; criterios 
geográficos, sociodemográficas o comportamentales, etc. 


9.5.2. Discriminante por árbol de decisión binario 

Cuando la variable a explicar es cualitativa la técnica de segmentación 
varia; se emplean discriminantes por árbol de decisión binario. Sin 
embargo, la interpretación se hace de forma idéntica. 

El gráfico 9.5 muestra un árbol de segmentación sobre la posibilidad de 
ahorro de los hogares de las personas mayores medida en términos de 
probabilidad. El árbol pone de relieve que solamente ahorra algo el 
26,80% de los hogares de la tercera edad, por término medio. Otra 
probabilidad significa que ha habido ausencia de respuestas y el programa 
calcula la probabilidad de que no se responda. 

Cuando las pensiones superan los 8.600 € la probabilidad de ahorro sube 
hasta el 48,82%. Cuando los ingresos superan los 16.700 € anuales, la 
probabilidad de que un hogar de estas características ahorre es del 73,58%, 
si bien solamente un 5,07% de los mayores tiene unos ingresos de esta 
cuantía. 


Gráfico 9.5. Posibilidad de ahorro de los hogares de la tercera edad en 

1998 



FuetUv: F.liihDnición pn>pia. 

Fuente: Elaboración propia. 


9.6. ANÁLISIS DISCRIMINANTE 
(AD) 


9.6.1. Introducción 

Es un conjunto de métodos que resuelve problemas de asignación a 
grupos. Supongamos que sobre una población se han definido dos o más 
grupos, con arreglo a una variable nominal: por ejemplo, los consumidores 
habituales de un produeto y los no consumidores. Ambos grupos se pueden 
definir por un conjunto de variables cuantitativas, como la renta, edad, 
ahorros, etc. 

El análisis discriminante proporciona una regla de decisión tal que dado 
un elemento nuevo, aún sin clasificar, del que se conocen las variables 
métricas, se le puede asignar a uno de los grupos iniciales, definido por 
una variable nominal. Por ejemplo, eonocida la edad, renta, etc., se puede 
prever si una persona va a consumir o no el producto. 

El AD es una técnica de dependencia. Explica una variable nominal en 
función de variables independientes métrieas o cuantitativas. 




En marketing es freeuente encontrar variables nominales que deben ser 
explicadas. El problema es que el AD necesita forzosamente variables 
métricas como explicativas. Por eso su utilización no está muy 
generalizada. 

El AD se ha empleado, por ejemplo, 

• Para analizar las diferentes formas de transporte urbano; coche o 
autobús teniendo en cuenta variables como edad, nivel económico, 
número de desplazamientos diarios ... Asi se han podido hacer 
previsiones de uso o no uso de autobús según la renta, la edad ... 
(siempre variables métricas). 

• Para evaluar el riesgo en la concesión de préstamos. Un banco 
dispone de información sobre los clientes que en el pasado hayan 
resultado solventes o morosos. Ante una nueva solicitud de crédito 
se valoran variables como edad, renta, importe del préstamo 
solicitado. Aplicando AD se puede prever si el cliente será solvente o 
no. 


9.6.2. Características del método 

Parte de una población dividida en dos o más grupos. Cada elemento 
pertenece a uno u otro grupo según la modalidad que posea de la variable 
cualitativa Y (compra o no compra, por ejemplo). Sobre cada elemento de 
la población se miden unas variables cuantitativas ... (renta, edad, 
ahorros, gasto medio en alimentos...). 

El AD busca una función discriminante o combinación lineal de las 
variables cuantitativas de tal forma que permita diferenciar mejor las 
clases. Es decir, que el valor de esta función en cada uno de los grupos sea 
lo más diferente posible. 


f(e) = v, X, + ...+v„X„ 



La función discriminante proporciona para cada elemento un valor f(e) 
muy diferente en eada grupo. 

Valorada la función discriminante para un nuevo elemento según el 
valor que tome se le asigna a uno u otro grupo. Esta función o bien sus 
coeficientes v^ ... Vj^^ la obtiene el AD maximizando el cociente entre la 

varianza entre grupos y la varianza intragrupos. 

El AD proporciona los coeficientes de la función discriminante y los 
valores a partir de los euales se asigna a eada uno de los grupos o bien la 
probabilidad de que esté en cada uno de los grupos. 


9.6.3. Aplicaciones 

Mediante un ejemplo muy seneillo se va a ilustrar la aplicación del AD. 

Supongamos que un constructor de piseinas desea valorar si 
determinadas familias son probables clientes, considerando su perfil 
soeioeconómieo. Para medirlo se consideran dos grupos compuestos cada 
uno por cuatro personas. El primero lo integran poseedores de piscina y el 
segundo familias a las que se les ha ofrecido y no la han adquirido. 

Se ha seleceionado dos variables que se supone expliean la posesión o 
no de piscina: es la superficie del terreno de los chales y X 2 , que mide 

el número de personas en la vivienda. Eos valores que toman estas 
variables en cada una de las familias de los grupos son los que aparecen en 
la tabla 9.9. 


Tabla 9.9 

1 500 6 

1 600 5 

1 700 6 

1 1000 4 




2 200 2 

2 300 3 

2 100 5 

2 550 3 


El primer número indica la pertenencia a los grupos 1 y 2. La siguiente 
cifra es la superficie del terreno y la última el tamaño de la familia. La 
función discriminante obtenida a partir de estos datos es, 

Y= - 27,55153 + 0,22076 + 3,917989 X 2 

Si para una nueva familia de la que se conoce la superficie del terreno y 
el número de miembros esta función tomara un valor positivo se la 
asignarla al grupo 1, de compradores de piscina. Si tomara valor negativo 
se le asigna al grupo 2. Por ejemplo, una familia con un terreno de 350 m^ 
y cuatro miembros proporciona Y = ^,1529. Se le asigna al grupo de los 
no compradores y sobre ella no se ejercerían presiones comerciales. 

Por el contrario una familia con 2.000 m^ de terreno y dos miembros 
proporciona Y = 421,8. Esto significa que casi seguramente construirá la 
piscina. 
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ANALISIS MULTIVARIANTE 
DE LA INFORMACIÓN 
(II).MÉTODOS DE 
INTERDEPENDENCIA 


10.1. INTRODUCCIÓN. OBJETIVOS 
DEL CAPÍTULO 


En este eapítulo y se tratan lo métodos multivariantes de forma intuitiva, 
seneilla y elara, sin aparato estadistieo ni demostraeiones eomplieadas -la 
persona interesada puede eonsultar los teenieismos en un libro de estadistiea. 
Se trata de eonseguir que el leetor aprenda a ser usuario entendido y eritieo 
de ellas. 

El esquema de exposieión de las téenieas se va a basar en el planteamiento 
seneillo de un easo y en la ilustraeión de eómo la herramienta eonsiderada es 
adeeuada para resolverlo. Se exponen las pautas de interpretaeión y las 
aplieaeiones del método. Las téenieas estadistieas multivariantes que se 
tratan son las siguientes. 

• Análisis de eomponentes prineipales. 


Análisis faetorial de eorrespondeneias simples. 






• Análisis factorial de correspondencias múltiples. 

• Análisis de elasificación o eluster. 

• Escalas multidimensional no métrico. 

Paralelamente a la exposieión de la téenieas también se realizan easos. 


10.2. JUSTIFICACIÓN DE LOS 

MÉTODOS MULTIVARIANTES 


Los métodos multivariantes de interdependeneia son herramientas 
estadisticas que relacionan las variables que se estudian, sin establecer 
ninguna relaeión de dependencia -como ocurre con la regresión, por ejemplo- 
sino que todas ellas se encuentran relacionadas. 

Los métodos multivariantes son métodos descriptivos o explicativos, no son 
métodos causales. Miden asociaeiones o interrelaeiones, pero no estableeen 
relaciones de causalidad, que han de ser formuladas por los analistas. Los 
métodos multivariantes siempre proporeionan un resultado que exige una 
interpretación minuciosa. En muchos casos los resultados son gráficos que 
pueden invitar a ser interpretados intuitivamente, sin tener en euentas las 
normas de interpretaeión. Se puede llegar a formular conclusiones 
equivocadas. 

Su utilización en investigaeión de mercados es masiva, por una serie de 
motivos. 

• La descripción de tablas mediante su observación es difícil cuando la 
dimensión es grande. Deben apliearse herramientas de análisis que 
permitan obtener conclusiones más matizadas que las de los análisis 
fragmentados de tablas cruzadas o simples gráficos. 


Los métodos multivariantes consideran todas las relaeiones entre los 
elementos de la tabla simultáneamente. Muchos fenómenos de marketing 





son multi vari ables. Por ejemplo, euando se trata de segmentar el 
mereado por estilos de vida, éstos son una sintesis de variables 
relaeionadas eon las aetitudes de los eonsumidores, intereses y 
opiniones. El perfil de un eonsumidor no queda determinado sólo por una 
earaeteristiea, sino que es una sintesis de muehas de ellas. Un estudio de 
mereado no es una simple sintesis de datos individuales, sino que debe 
deteetar, deseribir relaeiones y deteetar estrueturas. 

• El análisis multivariante permite en general, redueir los eriterios o 
faetores, seleeeionar los más importantes, jerarquizarlos, erear grupos y 
posieionarlos. 

• Son métodos fáeilmente aplieables y poeo eostosos. 

10.3. MÉTODOS FACTORIALES 


10.3.1. Introducción 

Con freeueneia se dispone de grandes tablas de datos o de fieheros eon las 
respuestas de algunas personas a distintas variables, eomo sus gastos, ingresos, 
valoraeiones o puntuaeiones dadas a earaeteristieas o atributos, ete. 

Estas tablas por su gran dimensión no se pueden entender direetamente. Es 
neeesario obtener una sintesis eliminando redundaneias. El análisis elásieo de 
medias, varianzas, eorrelaeiones, ete. sólo estudia aspeetos pareiales, y no 
proporeiona una visión global. 

Los métodos faetoriales eonstituyen un conjunto de técnicas descriptivas 
que analizan simultáneamente la informaeión proporeionada por gran número 
de variables o earaeteristieas. Estos métodos eombinan las variables buseando 
elementos eomunes y eliminan las redundaneias. Asi eonvierten las variables 
inieiales en un pequeño número de variables artifieiales o faetores que 
expliean un alto poreentaje de la informaeión que eontienen las variables 
inieiales. 



Si, por ejemplo, se analizan las respuestas de un eoleetivo a 50 preguntas 
relaeionadas eon el estilo de vida se puede redueir esta informaeión a unos 
poeos faetores donde el primero seria un indieador de un estilo de vida. Por 
ejemplo, si un eoehe es potente, rápido, aerodinámieo, estable y eon eambio de 
relaeión eerrada se diee que es un deportivo. Esta palabra sintetiza varias 
earaeteristieas o atributos, reduee la informaeión. Cuando se diee que una 
persona es inteligente se están sintetizando muehas de sus eualidades en una 
sola palabra; eapaeidad de reflexión, de sintesis, memoria, aptitud espaeial, 
aptitud numériea, orientaeión espaeial, ete. 

El proeedimiento eomún de los métodos faetoriales parte de una tabla de 
datos métrieas, de freeueneias, de variables eategórieas, que pueden estar 
ineluso, eombinadas. Se obtienen representaeiones gráfieas, simplifleadas de 
las relaeiones entre los elementos de la tabla y sobre el gráfieo se pueden 
estudiar las relaeiones entre las filas, entre las eolumnas y entre filas y 
eolumnas. 

Los ejes adquieren un signifieado al obtenerse de forma automátiea eomo 
eombinaeión lineal de las eolumnas. 

Por ejemplo, se podría analizar la siguiente tabla que reeoge en filas mareas 
de gel de baño y en eolumnas sus atributos. 

En esta tabla figuran las freeueneias de asoeiaeión entre mareas y atributos 
obtenidos a partir de una eneuesta. 30 signifiea que han sido 30 personas las 
que han opinado que «a» es un gel suave, ete. 



SUAVE 

NEUTRO 

.. AHWMTXX) 

a 

30 

45 

eo 
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56 

H 





Entrada 


Un análisis faetorial de estas tablas proporeiona el siguiente gráfieo. 
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En este gráfieo se podrían extraer eonelusiones, eomo que los geles «a» y 
«d» se pereiben pareeidos, son más suaves hidratantes y neutros que la media. 
El gel «i» es el más aromátieo. 

Los ejes se interpretan eomo los faetores en que se fijan los eneuestados 
para difereneiar los geles. El primer eje opone los geles más delieados a los de 
mayor poder desodorante. No existe un gel que se distinga simultáneamente 
por su delieadeza y efieaeia. Tras su análisis se eonoeen pereepeiones, hueeos 
de mereado, posieionamientos, ete. 


10.3.2. Fundamentos del análisis factorial: núcleo 
común 

A eontinuaeión se muestran los fundamentos y objetivos del análisis 
faetorial, a partir de un ejemplo. Una exposieión en profundidad se reeoge en 
Abaseal y Grande (1989). 

Datos 

El análisis faetorial se apliea a tablas reetangulares de datos. Pueden ser 
tablas métrieas, de freeueneias, de modalidades, ete. 






La matriz de datos se representa por X. Cada término x¡j representa el valor 
que toma la variable j para el individuo o fila i. 


Por ejemplo, la tabla que apareee a eontinuaeión reeoge las valoraeiones 
medias dadas por expertos, dentro del intervalo 0-5 de una eseala métriea, a 
treee mareas de eoehes respeeto a siete earaeteristieas, que apareeen en las 
siguientes eolumnas. 


Cuadro 10.1. Valoraciones dadas a características de marcas de coches 



Mecánica 

Estabilidad 

Habitabidad 

Comodidad 

EquiiMmienlo 

Prestaciones 

Consumo 

Alfa Romeo 

3 

3 

3 

3 

3 

4 

3 

Cilroén 

3 

3 

3 

4 

3 

3 

3 

Fiat 

3 

3 

4 

4 

3 

2 

3 

Ford 

3 

3 

3 

3 

3 

4 

3 

Honda 

4 

3 

3 

3 

4 

3 

3 

Lancia 

4 

4 

2 

2 

3 

4 

2 

Mazda 

4 

4 

2 

3 

5 

5 

2 

Nissan 

4 

4 

2 

3 

4 

4 

4 

Opel 

4 

3 

3 

3 

3 

3 

4 

Peugeot 

3 

4 

3 

3 

2 

3 

4 

Seat 

3 

5 

4 

4 

3 

3 

3 

Renault 

4 

3 

4 

3 

2 

4 

2 

Volskwagen 

4 

4 

3 

3 

3 

4 

3 


Podria pensarse que el mejor eoehe es el que tenga la puntuaeión total más 
alta. Puede sueeder que varias earaeteristieas midan el mismo atributo -por 
ejemplo, el equipamiento de un eoehe se podria medir por earaeteristieas 
eomo elevalunas eléetrieos, eierre eentralizado, direeeión asistida, faros 
antiniebla o aire aeondieionado- y el heeho de insistir en ellas haga que se esté 
sobrevalorando un modelo que tenga ese atributo que se mide de forma 
repetida. 

El análisis faetorial reduee esas earaeteristieas relaeionadas a unas poeas 
ineorreladas, no relaeionadas. 

Representación 

Cada individuo o fila, mareas de eoehes en este easo, está deserito por un 
eonjunto de variables, es deeir, por p números que reeogen el valor que toman 
las respeetivas variables para ese individuo. En este ejemplo Alfa 33 está 




descrito por 3 3 3 3 3 4 3, que son las calificaciones medias en las variables 
mecánica, estabilidad, etc. 

Cada individuo (coche) es un punto en un espacio de dimensión p (que son 
las características que se analizan; en este ejemplo p^7). Es imposible una 
representación gráfica de todos los individuos en este espacio, de siete 
dimensiones. 

Cada variable queda, también, descrita por n números, que son los valores 
que toma para cada uno de los individuos. Cada variable es un punto en un 
espacio de dimensión n. 

Por ejemplo, la variable mecánica descrita por los valores (en columna) 3, 
3, 3, 3, 4, 4, 4, 4, 4, 3, 3 y 4, son los valores que toma para las marcas Alfa, 
Citroen, ... VW. La variable mecánica -también las demás lo son- es un punto 
en un espacio de dimensión trece. 

El objetivo del análisis factorial de la tabla de datos es encontrar una 
representación simplificada de los individuos en un espacio de dimensión 
menor que p; generalmente, en dos o tres dimensiones. Estas no son una 
selección de algunas variables iniciales, sino variables sintéticas, obtenidas 
como combinaciones lineales de las variables iniciales. 

Estos ejes, llamados factores, se buscan de forma que la calidad de 
descripción de los individuos a través de ellos sea próxima a la obtenida con 
las variables originales. Es decir, que las diferencias que existen entre los 
individuos captadas por las p variables se mantengan en gran parte con un 
número pequeño de factores. Cada eje se acompaña de la cantidad de 
información que recoge. 

Un individuo descrito inicialmente por p variables se describe a través de 
unos pocos factores, acompañados de una medida de la calidad de 
representación, y se puede representar gráficamente en planos combinando los 
factores de dos en dos. 

En el ejemplo que se expone de los modelos de coches, en lugar de 
describirlos mediante la tabla de datos, se puede hacer a través del cuadro 
10.3, que mantiene el 60,42% de la información y que se puede representar en 
un plano, gráfico 10.1. El primer eje recoge el 44,07% de la información y el 


segundo el 13,35. Más adelante se estudiará eon mayor detenimiento los ejes y 
su signifieado. Por el momento basta eon intuir el proeedimiento y 
eomprenderlo en lineas generales. 


Cuadro 10.2. Valores propios 


fKM 

HUERO 

VALOR 

PROPIO 

SDE 

IfORM. 

S 

ACUM. 



3,0851 

44.07 

44.07 


1 


2 

1.1442 

16.35 

60.42 



Cuadro 10.3. Coordenadas de las marcas de coches 


MARCAS 

COORDENADAS 

1 

P. REL 

DISTO. 

1 

2 

Alfa Romeo 

7.69 

2.39 

0.21 

0.58 

Citroen 

7.69 

4.97 

1.67 

-0.11 

Fiat 

7.69 

10.87 

3.01 1 

1 0.16 

Ford 

7.69 

2.39 

0.21 

0.58 

Honda 

7.69 

3.39 

-0.44 

0.11 

Lancia 

7.69 

10.83 

-2.67 

0.86 

Mazda 

7.69 

15.40 

-3.38 

-0.63 

Nissan 

7.69 

7.40 

-1.65 

-1.86 

Opel 

7.69 

4.39 

0.32 

-0.15 

Peugeot 

7.69 

6.72 

1.42 

: -0.71 

Seat 

7.69 

11.72 

1.97 

-1.42 

Renault 

7.69 

8.63 

0.17 ! 

2.65 

Volskwagen 

7.69 

1.89 

-0.84 

-0.04 


Los factores o ejes son variables artifieiales que se obtienen eomo 
eombinaeiones lineales de las variables por los programas informátieos, de 
forma automátiea, de manera que son los que expliean mejor las difereneias 
entre los individuos. Reeogen lo que tienen en eomún las variables, 
eliminando las redundaneias. 

Generalmente las variables inieiales eontienen redundaneias. Por ejemplo, 
en un euestionario que tuviera eineuenta preguntas sobre aetitudes ante las 
promoeiones de ventas, seguramente habría varias preguntas que podrían estar 
midiendo distintos aspeetos de la misma variable, por ejemplo, la aetitud 
general ante las promoeiones. Esta aetitud es la que mide el faetor. 

Un faetor no se puede medir direetamente, eomo las variables o atributos 
que se analizan, pero existe y se obtiene mediante la eombinaeión de éstos. En 
este mismo eapitulo se muestra eómo se interpretan, en funeión de las 
variables inieiales. 






La importancia de los ejes es decreciente. El primero explica más 
información que el segundo, éste que el tereero, y asi sucesivamente. Los 
resultados de los análisis proporcionan la cantidad de información recogida 
por cada eje. Generalmente se tiene en cuenta un número de factores que 
proporeionen el poreentaje de informaeión que se considere suficiente en eada 
caso. 

En el gráfieo 10.1 se pueden estudiar las semejanzas y difereneias entre los 
coches a través de sus proximidades. Por ejemplo, las marcas Citroen y 
Peugeot se pereiben muy pareeidas en conjunto. Los que más se diferencian 
entre si son el Mazda y el Fiat. 

Gráfico 10.1. Representación de las marcas sobre los ejes i y 2 
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Paralelamente, se estudia el cuadro de datos inicial 10.1 reduciendo la 
dimensión del espaeio en que se sitúan las variables, buscando la mínima 
pérdida de informaeión. En lugar de deseribir las variables mediante 13 
dimensiones, en este caso, se hará a través de dos factores, que mantienen más 
del 60% de la informaeión. En el euadro 10.4 figuran los valores de las 
coordenadas de las variables en los dos ejes o factores, que se pueden 
representar en un plano, como muestra el gráfieo 10.2. 


Cuadro 10.4. Coordenadas de las variables 


VARIABLES 

CORRELACIÓN 

Identificador 

1 

2 

MECÁ - Mecánica 

-0.75 

0.13 

ESTA - Estabilidad 

-0.22 

-0.59 

HABI - Habitabilidad 

0.83 

0.32 













COMO - Comodidad 

0.77 

-0.30 

EQUI - Equipamiento 

-0.59 

-0.46 

PRES - Prestaciones 

-0.84 

0.13 

CONS - Consumo 

0.38 

-0.59 


Gráfico 10.2. Representación de las variables sobre los ejes i y 2 
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Sobre este gráfico se pueden estudiar las proximidades entre las variables y 
entre las variables y factores. 

Con las debidas precauciones -las tienen en cuenta los programas- ambos 
gráficos se pueden superponer y sobre este gráfico conjunto se estudian las 
situaciones relativas de los individuos respecto de las variables, gráfico 10.3. 
Por ejemplo, puede decirse que el Fiat se percibe más cómodo y habitable que 












la media pero eon peor meeániea y prestaeiones, también respeeto a la media, 
ete. 


Gráfico 10.3. Representación conjunta de marcas y características 



La calidad de representación. Las proyecciones, tanto de los individuos 
como de las variables, sobre los planos factoriales son deformaciones de la 
realidad. Para una interpretación correcta es necesario tener en cuenta una 
medida de la calidad de representación denominada coseno cuadrado. Cuando 
esta medida tome un valor próximo a uno sobre el eje o sobre el plano indica 
buena calidad de representación sobre ellos. 

Los elementos ilustrativos. Los métodos factoriales permiten proyectar 
sobre los planos variables e individuos que no intervienen en el análisis pero 
que al situarlos sobre ellos facilitan o enriquecen la interpretación. Por 
ejemplo, individuos medios por clase de renta, por nivel de edad, género, 
hábitat, etc. Estos elementos se denominan ilustrativos o suplementarios. 

Existen diversos métodos factoriales. Todos ellos tienen un núcleo común, 
similar al que acaba de exponerse, pero según sea la naturaleza de los datos a 
analizar, realizan unas transformaciones previas en ellos, dando lugar a 
distintos métodos. En general. 








Las tablas de variables métricas como renta, peso, gastos, puntuaciones 
medias, etc., se analizan mediante análisis de componentes principales. 


• Las tablas de frecuencias o de contingencia se analizan mediante 
análisis factorial de correspondencias. 

• Las tablas de variables nominales se estudian mediante análisis de 
correspondencias múltiples. 

En los próximos apartados se expondrán estas técnicas y se ilustrarán con 
ejemplos. 


10.4. ANÁLISIS DE COMPONENTES 
PRINCIPALES: ACP 


10.4.1. Características 

Esta técnica de análisis factorial analiza tablas de individuos en files 
variables métricas o traibutos en columnas. La palabra individuo indica algo 
repetitivo, como personas, marcas, empresas, etc. Como variables métricas se 
pueden utilizar los gastos, ingresos, etc. También se pueden considerar 
preguntas medidas con una escala de Likert, con diferenciales semánticos, o 
bien puntuaciones medias, etc. 

Una tabla de estas características puede ser muy heterogénea. Puede recoger 
lo que gastan por ejemplo, las familias en medicamentos, pan o alquileres 
junto a la superficie de las viviendas. Para poder considerarlas 
simultáneamente sin que influyan las unidades de medida el ACP transforma 
los datos centrándolos y tipificándolos. Esta operación la realizan los 
programas automáticamente antes de aplicar los algoritmos de análisis. 

Esta transformación confiere al ACP unas características propias: 

• La información que analiza es la matriz de correlaciones entre las 
variables. 



• Las proximidades entre las variables se interpretan en términos de 
eorrelaeiones. Dos variables muy eorrelaeionadas positivamente se 
sitúan muy próximas. Dos variables muy eorrelaeionadas negativamente 
está muy alejadas. Si son independientes su distaneia es intermedia. 

• La eoordenada de una variable sobre un faetor es su eorrelaeión eon él. 

• Cuanto más alejada esté una variable del origen en un plano faetorial 
mayor es la ealidad de representaeión sobre ese plano. Si figurara sobre 
una eireunfereneia de radio unidad se eneontraria perfeetamente 
representada. 

• Los faetores o ejes se interpretan en funeión de las variables eon los que 
están más eorrelaeionados. 

• La proximidad entre dos individuos bien representados indiea que son 
semejantes en el sentido de que toma valores próximos en el eonjunto de 
las variables. 

• La proximidad entre un individuo y una variable indiea que este 
individuo toma en esta variable valores superiores a la media. 

• La ealidad de representaeión de un individuo sobre un eje se mide por su 
eontribueión relativa o eoseno euadrado. 

• El origen de eoordenadas eorresponde al individuo de tipo medio. 

La interpretaeión del análisis permite, 

• Estudiar las relaeiones entre las variables a través de sus eorrelaeiones. 

• Conoeer las semejanzas entre los individuos y deteetar posibles grupos. 

• Interpretar las variables sintétieas o faetores a partir de sus eorrelaeiones 
eon las variables. 


Caraeterizar los grupos de individuos por las variables y earaeterizar los 
grupos de variables por individuos tipo. 



10.4.2. Una aplicación del análisis de componentes 
principales. Un estudio de las actitudes ante 
las promociones. 

El objetivo de este ejemplo es estudiar las aetitudes haeia las promoeiones 
de ventas, eómo se pereiben y evalúan por los eonsumidores. 

Tras una fase eualitativa se seleeeionaron siete tipos de promoeiones y se 
diseñó un euestionario que fue eumplimentado por diez personas. Cada 
persona debia indiear el grado de interés de eada una de las promoeiones, a 
través de una eseala de 1 a 10. 

En el euestionario se reeogieron algunas earaeteristieas soeioeeonómieas 
del eneuestado. En eondieiones reales se utilizarla una muestra mueho mayor 
y un euestionario más exhaustivo. Este ejemplo es inteneionadamente simple 
para faeilitar su perfeeta eomprensión. 

Las promoeiones seleeeionadas fueron las siguientes: 

Pl: mayor eantidad de produeto. 

P2: un vale de deseuento para la próxima eompra. 

P3: deseuento en el preeio señalado en la etiqueta. 

P4: posibilidad de partieipar en el sorteo de un regalo. 

P5: regalos por aeumulaeión de puntos. 

P6: obsequio unido al produeto. 

P7: fieha para partieipar en un eoneurso de TV. 

El euadro siguiente reeoge las valoraeiones eoneedidas por las diez personas 
(en filas) al interés que tiene eada una de las promoeiones (en eolumna). 



Cuadro 10.5. Valoraciones de las promociones 


Observa¬ 

ción 

Cantidad 

Vale 

Descuento 

Descuento 

Sorteo 

Puntos 

Obsequio 

Concurso 

TV 

Género 

01 

9 

8 

9 

7 

6 

6 

5 

1 

02 

10 

9 

9 

7 

7 

7 

6 

1 

03 

9 

9 

9 

6 

6 

7 

4 

2 

04 

8 

8 

8 

9 

8 

8 

9 

1 

05 

6 

6 

6 

9 

8 

8 

9 

1 

06 

5 

4 

4 

4 

3 

3 

2 

2 

07 

5 

4 

5 

3 

2 

2 

1 

2 

08 

6 

5 

5 

3 

3 

3 

2 

2 

09 

5 

5 

5 

2 

2 

3 

1 

2 

10 

4 

4 

4 

1 

1 

2 

1 

2 


La octava columna recoge el género: 1 indica mujer y 2, hombre. Esta 
variable es nominal, no métriea, y se analiza únieamente como ilustrativa. No 
interviene en el análisis pero sus modalidades se representan sobre el plano. 

El análisis de eomponentes prineipales (ACP) de los datos que apareeen en 
el cuadro 10.5 proporciona los siguientes resultados (cuadros 10.6 a 10.8) y el 
gráfico 10.4. 

El análisis proporciona siete ejes (tantos eomo variables inieiales). El 
euadro 10.6 reeoge la eantidad de informaeión explieada por eada eje (valor 
propio) y su porcentaje respecto del total. 


Cuadro 10.6. Valores propios 


FACTOfi 

NÚMERO 

VALOR 

PROPIO 

PORCENTAJE 

PORCENTAJE 

ACUMUL. 


1 

5.9975 

85.68 

85.68 



2 

.8907 

12.72 

96.40 


3 

.0627 

.90 

9980 


4 

.0255 

.36 

99.66 


5 

.0213 

.30 

99.97 


6 

.0020 

.08 

100.00 


7 

.0003 

.00 

100.00 



El primer eje recoge el 85,68% de la información, y entre los dos primeros 
el 98,40%. Los restantes factores se despreeian dada la eseasa informaeión que 
proporcionan. Sólo se interpretarán los dos primeros. 


El euadro 10.7 reeoge las eoordenadas de las variables sobre los ejes. Estas 
eoordenadas son también las eorrelaciones de la variables con el eje o factor. 






























Además, miden la calidad de representación de la variable sobre él, que será 
tanto mayor cuanto más se aproxime a la unidad en valor absoluto. 


Cuadro 10.7. Coocda n adaa. corrata ci oo M y antiouoa afta unKarioa 
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omx/Mwmiwet 
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La interpretación del primer factor se apoya en esta tabla y para ello debe 
comenzarse estudiando las coordenadas de las variables sobre el factor y elegir 
las más altas. En este caso se observa que todas las variables están al mismo 
lado del eje, pues tienen coordenada negativa. Todas están correlacionadas 
negativamente con él, y toman valores altos. 

El signo de los ejes es arbitrario, no importa el signo sino las posiciones 
relativas. Con otro programa de análisis podrian encontrarse todos los signos 
cambiados. 

El primer eje, en este caso, es un factor de talla que opone las personas que 
aprecian menos todas las promociones, situadas en el campo positivo, ante las 
que las aprecian más, situadas en el negativo. Es un factor de apreciación de 
las promociones. 

El cuadro 10.8 muestra las coordenadas de los individuos sobre los ejes, sus 
contribuciones a la formación del eje en porcentaje -la suma de las 
contribuciones de todas las variables al eje es 100- y sus cosenos cuadrados, 
que indican la calidad de representación de los individuos sobre los ejes. 

Un individuo se encuentra mejor representado sobre un eje cuanto mayor 
sea su coseno cuadrado, ya que este es el tanto por uno de la información del 
individuo explicado por ese eje. La suma de los cosenos cuadrados de un 
individuo en todos los ejes es la unidad. 













Cuadro 10.8. Coordenadas, contribuciones y cosenos cuadrado 


m. 

p.Ra. 

Disra 

COOROeiAOAS 

coNineucioiES 

COSENOS CIMIRUIO 

1 

2 

3 

4 

5 

1 

2 

3 

4 

5 

1 

2 


- 

5 

01 

’3í¡C' 

4.92 

-2C2 

i3 

-31 

22 

-33 

6i 

7.6 

15.4 


3 

.63 

•4 

.32 

.'01 

X 

(2 

UK 

6.96 

•283 

32 


-24 

-.14 

134 

95 

3 

223 

9,- 

.90 

.09 

X 

.01 

X 

a 

i30C’ 

6.16 

-212 

123 

31 

02 

26 

75 

17.3 

149 

2 

323 

.¡3 

25 

.32 

.00 

31 

u 

•303 

10.17 

-306 

-36 

36 

06 

-.■ie 

15.6 

63 

6 

25 

14.6 

.32 

.07 

X 

.00 

X 

IS 

•30C' 

6.46 

-1.K 

-2.15 

.10 

01 

.10 

6.4 

51.9 

15 

.3 

51 

.ti 

55 

X 

'X 

X 

06 


:.7 

2’2 

-36 

-25 

-.15 

.16 

75 

35 

126 

•35 

153 

.90 

.07 

X 

01 

3' 

07 

■300 

6ít 

252 

.10 

-ji 

22 

32 

105 

,1 

186 

■33 


,97 

oo 

.32 

.'01 

X 

06 


3.:>¡ 

171 

.19 

-.•3 

-2í 

-39 

43 

4 

•7 

213 

17 

96 

01 

X 

.02 

X 

IS 

•303 


231 

33 

31 

04 

36 

63 

13 

153 

5 

•4 

96 

.02 

X 

.X 

X 

•3 

•30C' 

1120 

332 


34 

07 

-.19 

16.4 

.3 

182 

1.7 

176 

99 

CD 

3’ 

X 

X 


La situación de una persona u observaeión sobre el primer faetor es un 
indiee de su apreeiaeión, en general, de las promoeiones. Asi la persona 4 es 
quien más las apreeia y la 10 es quien menos. Antes de estudiar la posieión de 
las personas es neeesario verifiear que están bien representadas. 

En este easo no interesa la opinión de personas individuales, sino 
únieamente si existen grupos de opinión y si el género se relaeiona eon las 
aetitudes. Para ello la variable género se analiza eomo ilustrativa y se obtienen 
las proyeeeiones de sus modalidades (hombre o mujer) sobre los ejes. 

El euadro 10.9 muestra sus eoordenadas sobre los ejes y sus valores test. Un 
valor test alto se puede interpretar eomo una eoordenada signifieativa. Para 
eonsiderar si una modalidad se eneuentra bien representada su valor test debe 
ser superior a 1,96 en valor absoluto. El examen del euadro eonfirma que las 
mujeres tienen una aetitud más positiva o mayor interés por las promoeiones 
que los hombres. 

El segundo faetor es mueho menos importante. Sólo reeoge el 12,72% de la 
informaeión. Opone las preguntas P4 y P7 (posibilidad de partieipar en el 
sorteo de un regalo y fieha para partieipar en un eoneurso de TV) a P3, P1 y P2 
(deseuento en el preeio señalado en la etiqueta, mayor eantidad de produeto y 
un vale de deseuento para la próxima eompra). 

Matiza entre los diferentes tipos de promoeiones. Opone aquellas personas 
más partidarias de las promoeiones «tangibles», (más produeto, menos preeio) 
a aquellas que suponen un eoneurso o un sorteo. Opone los realistas frente a 
los que prefieren el «riesgo» o eonfian en la fortuna. 






































No se aprecian diferencias (cuadro 10.9) entre hombres y mujeres ya que su 
valor test no supera el 1,96 en valor absoluto. 

Cuadro 10.9. Elementos ilustrativos: género del encuestado 



El gráfico 10.4 es la representación, sobre los ejes 1 y 2, y de las direcciones 
de las variables de alejamiento de las variables. (No es la representación de las 
variables, no se interpreta su distancia al circulo de radio 1). Cuanto más se 
aleje una observación del origen en la dirección de la flecha correspondiente a 
una variable, mayor es el valor que tiene en está. Las variables están bien 
correlacionadas con el plano, como muestras sus coordenadas sobre los ejes 1 
y 2. Existen dos grupos de variables. El primero lo forman las preguntas 
P1 (mayor cantidad de producto), P2 (un vale de descuento para la próxima 
compra) y P3 (descuento en el precio señalado en la etiqueta), que están muy 
relacionadas positivamente entre si, ya que están muy próximas. Son las que 
tienen que ver con reducción de precios o mayor cantidad de producto. 

Las personas que más aprecian una de estas promociones también son las 
que más lo hacen con las otras de ese mismo grupo. 

El segundo grupo lo integran las demás preguntas y su interpretación sigue 
el esquema expuesto. 

La calidad de representación de un individuo sobre el plano es la suma de 
las calidades de representación sobre los ejes. Por ejemplo, la persona 5 tiene 
unas calidades de representación de 0,45 en primer eje y 0,55 en el segundo. 
Esto significa que en plano (1,2) tiene un 100%, está perfectamente 
representada. Toda la información sobre ella está el plano que forman estos 
dos ejes. 

Podría ser interesante ampliar un estudio de estas características con más 
personas y más identificadores sociodemográficos, como nivel de renta, 
estudios, zona de residencia, etc., que actuarían como variables ilustrativas. 




















El ACP se puede utilizar para eualquier estudio en el que se disponga de 
gran eantidad de datos métrieos y se quiera redueir la dimensión o eneontrar 
sus estrueturas. Se puede apliear en los siguientes easos (ver Abaseal y 
Grande, 1994). 

- Test de producto. 

- Test de envase. 

- Estudio de posicionamiento. 

- Estudio de actitudes. 

- Segmentación por beneficios buscados. 

Gráfico 10.4. Representación gráfica de variables, individuos y elementos 

ilustrativos en los ejes 1 y 2 



10.5. ANÁLISIS FACTORIAL DE 
CORRESPONDENCIAS. AFC 

10.5.1. Características 


Este método ha sido diseñado para el análisis de tablas de contingencia y de 
frecuencias. Se aplica cuando dos conjuntos se encuentran relacionados. A 













través de un ejemplo se expondrá el método. 

Supongamos que en una encuesta se ha recogido información sobre distintas 
marcas de yogures y sus caracteristicas a través de una escala de asociación. El 
cuadro 10.10 muestra las frecuencias de asociación de cada marca con las 
distintas caracteristicas estudiadas. 


Cuadro 10.10. Tabla de frecuencias de asociación entre marcas y atributos 



Variedad 
de sabores 

Nutritivo 

Gusta a 
los niños 

Muchos 

Aditivos 

Prestigioso 

Calidad 

Azalea 

30 

30 

20 

15 

28 

30 

Rosa 

28 

28 

18 

16 

26 

29 

Petunia 

15 

10 

15 

23 

9 

9 

Tulipán 

14 

13 

16 

27 

18 

8 

Jacinto 

16 

12 

25 

24 

7 

10 

Narciso 

15 

25 

24 

25 

26 

25 


De forma general el AFC analiza tablas que cruzan marcas u objetos por 
caracteristicas. El valor de la tabla, n^- es el número de personas que han 
asociado el objeto i con la característica j. 

El objetivo del análisis es buscar una representación simplificada de las 
relaciones entre las lineas (marcas), entre las columnas (caracteristicas) y 
entre lineas y columnas. Esto se consigue a través de un análisis factorial, pero 
es necesario considerar las particularidades de esta tabla. 

- Las cifras de las tablas son números positivos. 

- Las filas y las columnas juegan el mismo papel. Interesa relacionar las 
marcas entre si y también las caracteristicas entre si. 

El AFC considera que dos filas (marcas) son semejantes si sus perfiles o 
porcentajes/fila son semejantes. Asi, si una marca es muy conocida puede 
tomar valores más altos en todas las columnas que otra poco conocida. Si se 
consideraran las diferencias en valores brutos se obtendría un valor alto que 
recoge la diferencia en número de opiniones sobre cada marca, pero no las 
diferencias de comportamiento o de percepción de cada una de ellas en sus 
caracteristicas. En AFC se consideran semejantes si sus porcentajes en cada 
característica están próximos. Lo mismo puede decirse para las marcas. 















El AFC del cuadro 10.10 equivale a realizar dos análisis factoriales; uno 
sobre los perfiles de columnas, que recogen los atributos o características 
(cuadro 10.11), y otro sobre los perfiles de las filas, que recogen las marcas u 
objetos (cuadro 10.12). 


Cuadro 10.11. Perfiles de los atributos 



Sabores 

Nutritivos 

Niños 

Aditivos 

Prestigio 

Calidad 

Azalea 

25,42 

25,42 

16,95 

11,54 

24,56 

27,03 

Rosa 

23,73 

23,73 

15,25 

12,31 

22,81 

26,13 

Petunia 

12,71 

8,47 

12,71 

17,69 

7,89 

8,11 

Tulipán 

11,86 

11,02 

13,56 

20,77 

15,79 

7,21 

Jacinto 

13,56 

10,17 

21,19 

18,46 

6,14 

9,01 

Narciso 

12,71 

21,19 

20,34 

19,23 

22.81 

22,52 

Total 

100 

100 

100 

100 

100 

100 


Cuadro 10.12. Perfiles de las marcas 



Sabores 

Nutritivos 

Niños 

Aditivos 

Prestigio 

Calidad 

Total 

Azalea 

19,61 

19,61 

13,07 

9.80 

18,30 

19,61 

100 

Rosa 

19,31 

19,31 

12,41 

11,03 

17,93 

20,00 

100 

Petunia 

18,52 

12,35 

18,52 

28,40 

11,11 

11,11 

100 

Tulipán 

14.58 

13,54 

16,67 

28,13 

18,75 

8,33 

100 

Azalea 

17,02 

12,77 

26,60 

25,53 

7.45 

10,64 

100 

Rosa 

10,71 

17,86 

17,14 

17,86 

18,57 

17,86 

100 


Se obtienen asi unas coordenadas de las columnas y de las filas sobre los 
ejes factoriales. Ambas están relacionadas de forma que la coordenada de una 
marca o fila «i» sobre un eje factorial es igual a la suma de las coordenadas 
sobre el eje de las caracteristicas o columnas «j», ponderadas por el peso o 
importancia relativa de la caracteristica «j» en la marca «i» (n¡j/n¡) y 
multiplicado por una constante menor que uno, un coeficiente de dilatación. 


La coordenada de i sobre el 


ej 


ie« = *ST 


la coordenada de j sobre el eje 


a 


Donde k es el inverso de la raiz del valor propio del eje a. 

Es decir, salvo el coeficiente de dilatación k que aleja del origen, la 
coordenada de una marca depende de las coordenadas de las caracteristicas. Es 
su centro de gravedad ponderado por el peso o importancia relativa de la 
caracteristica en la fila. Por lo tanto, estará más alejada del origen en la 
dirección de aquella caracteristica que tiene mayor importancia en la marca. 






























Recíprocamente, las coordenadas de las columnas j sobre el factor se 
expresan en función de las coordenadas de las filas i sobre el mismo. Salvo un 
coeficiente de dilatación la coordenada de una característica se aleja del origen 
en la dirección de la marca que tiene mayor importancia en ella. 

Dada la naturaleza del AFC, la interpretación de los gráficos tiene el 
siguiente significado. 

• Si dos filas (marcas) tienen perfiles próximos, es decir, los 
porcentajes/fila de ambas son parecidas, aparecerán próximos sobre el 
gráfico de los planos factoriales. Si aparecieran alejados en el gráfico 
indica que tienen perfiles diferentes. 

• Si dos columnas (características) tienen perfiles próximos, es decir, los 
porcentajes/columna de ambas son parecidas, aparecerán próximos sobre 
el gráfico de los planos factoriales. Si aparecieran alejados en el gráfico 
indica que tienen perfiles diferentes. 

• Una fila (marca) cuyo perfil sea el de la media de las filas (marcas), es 
decir, fila (marca) de características medias se proyecta en el origen de 
coordenadas. Los mismo ocurre con las columnas. 

• La interpretación de los ejes se hace de la misma forma que en el ACP, 
buscando las filas y columnas con las que estén más relacionados. Los 
programas de AFC proporcionan para cada elemento, fila o columna, su 
coordenada, la contribución del elemento a la formación del factor y 
calidad de representación del elemento sobre los ejes, denominada 
coseno cuadrado. 

10.5.2. Una aplicación de AFC: el posicionamiento de 
los yogures 

Con objeto de ilustrar el método que acaba de exponerse se va a analizar la 
tabla 10.10 con el fin de posicionar unas marcas de yogures denominadas 
Azalea, Rosa,... 



Al elegir para su análisis la opción AFC el programa proporciona los 
siguientes resultados. 


• Cuadro 10.13. Contiene los valores propios, porcentajes de información 
de los ejes y porcentajes acumulados. 

• Cuadro 10.14. Muestra las coordenadas de las filas o marcas, 
contribuciones o participación de la marca en porcentaje en la formación 
de cada factor (la suma de cada columna vale 100%) y cosenos cuadrado, 
o calidad de representación de las marcas sobre los ejes (su suma por 
filas vale uno como máximo). 

• Cuadro 10.15. Muestra las coordenadas de las columnas o atributos, 
contribuciones o participación de la caracteristica en % en la formación 
de cada factor (la suma de cada columna vale 100%) y cosenos cuadrado 
o calidad de representación de las caracteristicas sobre los ejes (su suma 
por filas vale uno como máximo). 

• El gráfico 10.5 muestra la representación de las marcas y de las 
caracteristicas sobre el plano factorial (1,2). 


Cuadro 10.13. Valores propios 


NÚMERO 

VAIOR 

PROPIO 

PORCENTAJE 

PORCENTAJE 

ACUMUL 


1 

.0621 

77.82 

77.82 



2 

.0107 

13.45 

91.27 


3 

.0061 

7.69 

96.96 


4 

.0006 

1.04 

100.00 

•• 

5 

.0000 

.00 

100.00 



Cuadro 10.14. Contribuciones, coordenadas y cosenos cuadrado de las marcas 

































Cuadro 10.15. Contribuciones, coordenadas y cosenos cuadrado de los atributos 



En el cuadro 10.13 puede observarse cómo tres factores recogen casi el 99% 
de la información. El primero explica el 77,82%, es decir, si se reduce la 
dimensión del problema de seis variables a una se mantienen más de un 75% 
de la información o de las diferencias entre las marcas. Al tener en 
consideración dos factores se mantiene el 91,27% magnitud más que 
suficiente para interpretar el estudio. Por este motivo no merece la pena 
interpretar el tercer factor. 

La interpretación de los factores se apoya en los cuadros 10.14 y 10.15. 
Puede comenzarse por cualquiera de ellas. Empezaremos por las 
caracteristicas. 

• Se eligen las que más contribuyen a la formación del factor. En este caso 
son las caracteristicas ADITIVOS (48,7), GUSTA A LOS NIÑOS (13,7) 
en el campo positivo, y oposición CALIDAD (19,8). Todas ellas están 
bien representadas sobre el eje (cosenos cuadrados altos). También la 
caracteristica NUTRITIVO está bien representada (0,98) y del lado de la 
calidad. En consecuencia se interpreta como un eje de bondad de 
producto que opone los yogures de más calidad y nutritivos a los que 
tienen más conservantes y gustan a los niños. 

• En cuanto a las marcas todas, salvo Narciso, tienen contribuciones 
importantes y están bien representadas. Opone las marcas Azalea y Rosa, 
asociadas a CALIDAD y NUTRITIVO a Petunia, Tulipán y Jacinto, más 
ligadas a GUSTA A LOS NIÑOS y ADITIVOS. 

• El segundo eje es menos importante que el primero. Casi la mitad del eje 
(46,4%) lo constituye PRESTIGIOSO en oposición a SABORES y en 
menor medida GUSTA A LOS NIÑOS. 























• En cuanto a las marcas, se oponen Tulipán y Narciso a Jacinto. 

Sobre el plano (1,2), Gráfico 10.5, se observa el posicionamiento de las 
marcas. Azalea y Rosa son las marcas de mayor calidad. No están bien 
representadas sobre el segundo factor y se sitúan en una posición intermedia 
entre variedad y prestigio, porque destacan en ambas caracteristicas, mientras 
que Narciso se asocia a prestigio y se sitúa mal en el primer eje, porque ambas 
caracteristicas de calidad y aditivos son importantes en su perfil. 

La marca Jacinto, bien representada sobre el primer eje se asocia con 
aditivos y contribuye mucho al segundo, sobre el se asocia gusta a los niños. 
Son las dos caracteristicas que destacan en esta marca. La marca Tulipán se 
asocia fundamentalmente con aditivos. 

Gráfico 10.5. Ejes 1 y 2 
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Aunque sea un herramienta diseñada para tablas de frecuencias, se puede 
aplicar para analizar cualquier tabla de números positivos siempre que tengan 
sentido las frecuencias marginales de las filas y de las columnas (ver Abascal 
y Grande, 1994). Es uno de los métodos factoriales más utilizados en 
marketing. Por ejemplo en, 

- Posicionamiento de productos. 

- Imagen de marca. 















- Elección del nombre de un producto. 

- Elección de mensaje y anuncio publicitario. 

- Eficacia publicitaria. 

10.6. ANÁLISIS DE 

CORRESPONDENCIAS 
MÚLTIPLES (ACM) 


10.6.1. Características 

Es un método factorial diseñado para el análisis de tablas de modalidades, 
es decir, tablas que describen un conjunto de individuos a través de las 
variables cualitativas o nominales. Es semejante al AGP. Si bien en este las 
variables son métricas, en el ACM son nominales o categóricas. En la 
siguiente tabla se recogen las respuestas de un grupo de personas a un 
cuestionario sobre sus hábitos como telespectadores y sus características 
sociodemográficas. 

Las preguntas de hábitos se responden con una escala de 3 categorías: 

1 Habitualmente, 2 Esporádicamente, 3 Nunca 

Pl. ¿Ve los noticiarios ?: 

P2. ¿Ve películas? 

P3. ¿Ve documentales? 

Se pueden recoger también preguntas de caracterización del encuestado 


Género 1 ^ Hombre 2 ^ Mujer 



Identificador 

Pregunta 1 

Pregunta 2 

... 

Género 

1 

1 

2 


1 

2 

2 

1 

••• 

2 


Esta tabla indica que la persona (ind) 1 es espeetadora habitual de notieias, 
esporádiea de pelieulas y doeumentales y es hombre. 

El ACM es una generalizaeión del AFC. Este estudia las relaeiones entre las 
modalidades de dos variables (tabla de eontingeneia). El ACM estudia las 
relaeiones entre las modalidades de un eonjunto de variables. En este easo 
permite estudiar las relaeiones entre las modalidades de eomportamiento 
televisivo y earaeterizarlo por el género que se ineluiria eomo ilustrativo. En 
este ejemplo se podría estudiar qué otros programas y su grado de insisteneia 
ven las personas habituales de los notieiarios, su género, hábitat, ete. 

El ACM también permite estudiar el eomportamiento medio de elases de 
individuos. Es deeir, analizar «quién haee qué» entendiendo eomo quién a un 
grupo de personas definido por una eategoria. 

El AFM, eomo todo método faetorial obtiene representaeiones gráfieas. En 
este easo se representan todas las modalidades de respuesta, lo que faeilita el 
estudio de las relaeiones. También se pueden representar los individuos. 

En easo de no disponer de un programa de ACM se puede utilizar uno de 
AFC aplieado a la tabla disyuntiva eompleta (TDC). En este easo será la tabla 
siguiente. 


Identificador 

Pregunta 1 

Pregunta 2 


Género 

de la 









Resp: 1 

Resp: 2 

Resp: 3 

Resp: 1 

Resp: 2 

Resp: 3 


Resp: H 

Resp: M 

persona 

1 

1 

0 

0 

0 

1 

0 


1 

0 

2 

0 

1 

0 

1 

0 

0 

... 

0 

1 


Los resultados de ambas eoineiden. Dadas las earaeteristieas del método es 
muy útil para el tratamiento eonjunto de un eneuesta. Téngase en euenta que 






















cualquier variable métrica se puede convertir en cualitativa. Por ejemplo, la 
edad eonsiderando sólo tres niveles: joven, adulto, mayor. 

La interpretación de ACM es semejante a la del AFC, puesto que es un AFC 
de la tabla TDC. Sin embargo, las TDC tienen unas earaeteristicas propias y 
unas propiedades numérieas que hacen que el ACM sea un método diferente 
eon sus earaeteristicas propias. Son las siguientes. 

• La proyección de una modalidad sobre un eje es el baricentro de la 
proyeeeión de los individuos que poseen esa modalidad. Es deeir, 
representa la situación media de las personas que poseen esa categoría. 

• La proyeeeión de un individuo sobre un eje es el barieentro (salvo el 
coeficiente de dilatación) de la proyección sobre el eje de las 
modalidades que posee. 

• La distaneia entre dos modalidades es mayor cuanto mayor sea el número 
de personas que poseen una y sólo una de estas. 

• La contribución de una variable a un factor se define eomo la suma de las 
contribueiones de sus modalidades. 

• Las modalidades raras, elegidas por pocas personas alejan mueho a sus 
poseedores de los demás, y por lo tanto contribuyen mueho a la 
formación de los ejes. Por eso es aconsejable eliminar las modalidades 
raras uniéndolas a las más próximas. Si no se haee asi los primeros 
factores pueden estar determinados por estas y no reflejar fenómenos 
generales. 

Cuantas más modalidades de respuesta tenga una pregunta mayor es su 
eontribueión a la eantidad de información. Para evitar influeneias extremas 
conviene que el número de modalidades de las preguntas esté equilibrado y no 
haya preguntas con un número excesivo de ellas. 

• Cuando las variables tienen muchas modalidades, dado que la tabla es 
disyuntiva eompleta, éstas son perpendieulares y no pueden ser recogidas 
por el mismo faetón Cuanto mayor sea el número de modalidades de una 
pregunta, mayor es el número de ejes sobre los cuales influye. 



• El porcentaje de inercia de cada factor es pequeño cuando las variables 
tienen muehas modalidades. 

• Las modalidades de respuestas de eada una de las variables están 
eentradas, es decir, el centro de gravedad de las modalidades de 
respuesta es el origen. 

Estas earacteristieas deben de tenerse en cuenta a la hora de diseñar el 
análisis y evitar considerar un número grande de modalidades para eada 
pregunta. 


10.6.2. Una aplicación del ACM. La ocupación del 
tiempo libre por los jóvenes 

El objetivo de este estudio es conocer cómo pasan su tiempo libre unos 
jóvenes. Para ello se ha realizado una eneuesta entre los jóvenes de una 
comunidad. A cada encuestado se la ha pedido que indique para eada 
actividad: discoteca, lectura, música, bares y deportes, si la realiza eon mucha 
frecuencia, poca o nada. 

Para identificar quién realiza las actividades se han reeogido las 
caraeteristicas de género y nivel de estudios. Con objeto se simplificar el 
ejemplo y favoreeer la comprensión del método se analizan únicamente las 
respuestas fieticias de 18 jóvenes a las preguntas sobre las einco actividades 
citadas, y dos variables de earacterizaeión que son el género y el nivel de 
estudios, clasificado en elementales, medios y superiores. 

Los datos figuran en el euadro 10.16 en el que las eineo primeras eolumnas 
indiean las modalidades de respuesta a las aetividades indicadas en el orden 
antes expuesto. 

Los códigos de interpretaeión son 1 ^ nada, 2 ^ poeo, 3 ^ mucho. Las 
variables de caraeterizaeión oeupan las dos últimas columnas. El la sexta 1 ^ 
hombre y 2 ^ mujer. En la séptima 1 ^ estudios primarios, 2 ^ medios y 3 = 
superiores. 


Cuadro 10.16 


Observa¬ 

ción 

discoteca 

lectura 

música 

bares 

deportes 

género 

Nivel de 
estudios 

01 

3 

1 

2 

3 

3 

2 

1 

02 

3 

1 

3 

3 

1 

2 

1 

03 

3 

2 

1 

2 

2 

2 

2 

04 

2 

2 

2 

2 

1 

2 

2 

05 

1 

3 

3 

1 

2 

2 

3 

06 

1 

3 

3 

2 

3 

2 

3 

07 

2 

2 

1 

3 

1 

2 

2 

08 

2 

1 

1 

2 

3 

2 

1 

09 

3 

1 

2 

3 

1 

2 

1 

10 

3 

1 

3 

3 

3 

1 

1 

11 

2 

1 

2 

1 

1 

1 

1 

12 

2 

2 

2 

2 

3 

1 

2 

13 

2 

2 

2 

2 

2 

1 

3 

14 

1 

3 

2 

1 

3 

1 

3 

15 

1 

3 

3 

1 

2 

1 

3 

16 

2 

1 

1 

2 

1 

1 

1 

17 

2 

2 

2 

3 

3 

1 

2 

18 

1 

1 

1 

3 

3 

1 

2 


Debido a que son variables nominales se analiza mediante ACM, que va a 
permitir relaeionar las variables entre si. Como existen dos tipos de variables, 
las de eomportamiento, las eineo primera eolumnas, y las de earaeterizaeión, 
las dos últimas, se analizan las primeras eomo aetivas y las últimas 
únieamente eomo ilustrativas. 

Este análisis va a permitir estudiar las relaeiones entre las modalidades 
indieando, por ejemplo, si los que aeuden mueho a las diseoteeas leen mueho, 
poeo o nada, ete. Es deeir, qué modalidades se dan simultáneamente y euáles 
no. 


El uso de elementos ilustrativos va a permitir eonoeer quiénes son los que 
realizan las distintas aetividades. Por ejemplo, si quienes eseuehan mueha 
músiea son hombres, mujeres o ambos o euál es su nivel eultural. 

Los resultados del análisis son los siguientes: 

Cuadro 10.17, eontiene los valores propios y los poreentajes de informaeión 
de eada eje. 





























Cuadro 10.18, recoge las coordenadas de las modalidades, sus 
contribuciones y cosenos cuadrados. 

Cuadro 10.19, recoge para los elementos ilustrativos sus coordenadas y 
valores test. 


El gráfico 10.6 representa las modalidades sobre el plano (1,2). 


También se podrian obtener las coordenadas de los individuos, pero en este 
caso no tiene interés, pues interesan sólo los grupos, no el comportamiento 
detallado de cada persona. 


Cuadro 10.17. Valores propios 


NUMERO 

VALOR 

PROPIO 

PORCENTAJE 

PORCENTAJE 

ACUMUL. 



.6037 

30.18 

30.18 


1 


2 

.4077 

20.38 

50.57 


3 

.2351 

11.75 

62.32 


4 

.2237 

11.18 

73.50 


5 

2029 

10.14 

83.65 


6 

.1193 

5.97 

89.61 


7 

.1057 

5.29 

94.90 


8 

.0612 

3.06 

97.96 


9 

.0303 

1.52 

99.47 


10 

.0105 

.53 

100.00 

•• 


La cantidad de información que recogen los primeros ejes podria aparecer 
débil, pero no es asi, pues en ACM al obtener un número elevado de ejes estos 
no recogen porcentajes muy altos. Limitamos la interpretación a los dos 
primeros ejes, por ser suficiente. 

Para interpretar los factores se acude al cuadro 10.18. Obsérvese que las 
modalidades de una misma pregunta están siempre centradas en el origen. 

Primer factor. Dos preguntas tienen una contribución importante: son 
discoteca y lectura. La menos importante es deportes, que contribuye sólo con 
un 11%. En cuanto a las modalidades de mayor contribución son lectura 
mucho, bares nada, discoteca nada y música mucho. Todas ellas están situadas 
en el campo positivo. Es un factor que opone aquellas personas que leen y 
escuchan música en grado de «mucho» y no acuden a los bares y discotecas, 
frente al resto. 


















Es decir, las personas que se dedican sólo a actividades culturales y nada a 
las sociales frente a los demás, que tienen comportamientos menos extremos. 

Si se observan las modalidades ilustrativas en el cuadro 10.19, se aprecia 
que no hay diferencias significativas entre hombres y mujeres (el valor test 
sobre el primer eje 0,4 es pequeño). Sin embargo, si existen diferencias por 
nivel cultural. 

Las personas de esta muestra con estudios superiores son las que realizan en 
grado máximo las actividades culturales (individuales) y no realizan las 
sociales (bares y discotecas). 

Segundo factor. A su formación contribuyen mucho tres variables: 
discoteca, lectura y bares, y no contribuyen apenas música y deportes. Opone 
las modalidades discoteca mucho, lectura nada, bares mucho a las 
modalidades discoteca, lectura y bares -todos- poco. Es decir, opone los 
jóvenes que se dedican mucho a las actividades sociales y nada a la lectura a 
los que hacen un poco de todo. 

Sobre este factor tampoco se observan diferencias significativas entre 
hombres y mujeres, pero si respecto al nivel de estudios (el valor test sobre el 
segundo eje de estudios elementales es 2,6). Los que tienen estudios 
elementales no leen y se dedican mucho a las actividades sociales. 


Cuadro 10.18. Coordenadas, contribuciones y cosenos cuadrados 
de las categorías activas 



Cuadro 10.19. Coordenadas y valores test de las categorías ilustrativas 
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COOffiENAOtS 

nSTANOAS 

OEN-niOUCTAS 

EFECT. 

FCSO 

1 

2 

3 

4 

5 

1 

2 

3 

4 

5 


6iG(nen) 

Af.l-tortys 

9 

9CC 

0< 

07 

-13 

-C.9 

-05 

C.16 

016 

-039 

■033 

-0" 

ICO 


9 

9K 

-:4 

-17 

13 

M 

C5 

■009 

-0'6 

039 

033 

111 

ICO 

7.IMestuiios 

/C.l-Ebneiaes 

1 

m 

-li 

-2.6 

-03 

M 

« . 

-047 

473 

m 

333 

-034 

157 

IC2-VeiX& 

i 

Etc 

-17 

15 


-C.6 

07 

-053 

05' 

0'5 

-036 

335 

2C0 

AG.3-Sit«itK 

5 

EE 

U 

13 

•a 

00 

C.4 

'35 

050 

•OIC 

301 

117 

260 


Sobre el plano (1,2), gráfico 10.6, se observan claramente las relaciones. 
Este plano recoge el 50% de la información y ambos ejes son importantes. 

Sobre él se observan tres grupos de modalidades. Un grupo situado en el 
campo positivo indica que los que leen mucho no van a bares ni discotecas. 
Son los jóvenes con mayor nivel cultural. Los que no leen están en el tercer 
cuadrante acuden mucho a bares y discotecas y son las personas con menor 
nivel de estudios. 



























































Sobre el cuarto cuadrante se sitúa música mucho. Es una caracteristica que 
comparten ambos grupos. Es decir, no es exclusiva de las personas menos 
sociables, sino que las personas que realizan las actividades sociales en grado 
máximo también les gusta mucho escuchar música, al margen del nivel 
cultural. 

Sobre el segundo cuadrante se sitúan todos los poco, excepto deportes, es 
decir, las personas que realizan todas las actividades en grado medio, incluso 
también los deportes porque al situarse deportes poco en el primer cuadrante 
es una actividad compartida por este grupo y el primero de ellos (los menos 
sociables). 

El grupo que acaba de describirse se caracteriza por tener estudios medios. 

La variable deportes es independiente de las demás. Mucho deporte se sitúa 
próximo al origen y está mal representada. 

En resumen, no existen diferencias significativas entre hombres y mujeres 
pero si según los niveles de estudios. 

Gráfico 10.6. Representación de las categorías sobre los ejes i y 2 
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El tercer factor es fundamentalmente un eje de música. Matiza entre los que 
no escuchan música y los que lo hacen poco. 











Dado que el ACM estudia las relaeiones entre las modalidades de variables 
eualitativas, tiene grandes posibilidades de aplieaeión en estudios de mereado. 


Sin embargo, por ser un método reeientemente desarrollado por estadistieos 
franeeses no se ha generalizado su uso en España. 

Es freeuente que para analizar datos de respuesta en un euestionario a 
preguntas medidas en una eseala de Likert se utiliee el ACP eonvirtiendo en 
métriea una variable que en realidad es de orden. Estas mismas respuestas se 
pueden analizar mediante ACM eonsiderando eada modalidad de respuesta 
eomo tal. 

El ACM proporeiona una representaeión gráfiea más matizada al 
representar eada modalidad por un punto, mientras que el ACP representa eada 
variable por un únieo punto. 


10.7. ANÁLISIS DE CLASIFICACIÓN 


10.7.1. Introducción: los métodos 

El análisis de elasifieaeión es un eonjunto de métodos que obtienen grupos 
de objetos o de individuos semejantes de aeuerdo eon algún eriterio. Estos 
objetos están deseritos por eierto número de variables o earaeteristieas y es 
neeesario definir una medida de homogeneidad a partir de la eual se deteetan 
los grupos. 

Los métodos de elasifieaeión o análisis cluster o tipologia, tienen gran 
interés para la direeeión de marketing. Permiten eneontrar mareas semejantes 
o eompetidoras, grupos de eonsumidores semejantes de aeuerdo eon variables 
tales eomo estilos de vida, gustos, ventajas buseadas en los produetos, ete. que 
formarán los distintos segmentos de mereado. También se pueden busear 
grupos de promoeiones semejantes, de soportes publieitarios, ete. 

Si el eonjunto que se desea elasifiear está deserito por una sola variable la 
obteneión de los grupos es seneilla. Por ejemplo, si la variable es métriea, 
eomo la renta, un grupo estará formado por los que tomen los valores más 



altos. Si la variable es ordinal, por ejemplo orden de prefereneias sobre 
mareas, los grupos se pueden formar por los que presenten eoefieientes de 
eorrelaeión por rangos más altos. 

Los métodos de elasifieaeión permiten obtener grupos homogéneos 
eonsiderando simultáneamente gran número de variables o earaeteristieas para 
deseribir a los elementos que eomponen la poblaeión que se elasifiea. Por 
ejemplo, si se desea deteetar grupos de eoehes semejantes se pueden deseribir 
por sus ealifieaeiones en poteneia, equipamiento, linea, prestaeiones, ete. 

La elasifieaeión eonsidera dos eoehes semejantes y los asigna al mismo 
grupo si se pareeen en el eonjunto de las earaeteristieas, no sólo en una. 

La elasifieaeión obtiene no sólo los grupos sino que los programas de 
elasifieaeión proporeionan informaeión que ayuda a interpretarlos, eomo son, 

- Una medida de su homogeneidad 

- La distaneia entre los grupos. 

- Desoribe eada grupo a través de un objeto tipo, o bien lo resume por los 
valores medios de las variables en el interior de eada grupo. Por ejemplo, 
podría deeir que el grupo formado por lo eoehes que denominamos 
utilitarios tienen una valoraeión media en sus atributos poteneia ^ 2, 
equipamiento ^ 1 , ete. 

- Para las variables eualitativas indiean los poreentajes de individuos de la 
elase que tienen la modalidad y el poreentaje de individuos que habiendo 
elegido esa modalidad se eneuentran en la elase. 

La obteneión de los grupos se basa en una medida de la similitud, o bien de 
las difereneias (disimilitudes) entre los objetos que se han de elasifiear. La 
eleeeión de la medida adeeuada debe haeerse en funeión del tipo de variables 
utilizadas para la deseripeión de los objetos. Por ejemplo, si las variables son 
métrieas, eomo los gastos de las familias en bienes y servieios, o una 
valoraeión de 1 a 10 de las earaeteristieas de unas mareas, se puede emplear 
eomo medida de las difereneias (disimilitudes) la distaneia euelidea. 



Si interesara la semejanza en términos de perfiles (los yogures más 
pareeidos del apartado 10.5) se puede emplear la distaneia ehi-euadrado. 

Existe gran variedad de medidas de distaneia y de semejanza. En eada easo 
será neeesario elegir la adeeuada. Los diversos métodos de elasifieaeión se 
difereneian no sólo por esta medida sino también por la téeniea de agregaeión. 
Pueden elasifiearse en dos tipos. 

- Los métodos jerárquieos eonstruyen un árbol de elasifieaeión. Puede ser 
deseendente o aseendente. Este último es el más habitual. Consiste en 
formar inieialmente tantos grupos eomo objetos, n. Por ejemplo, tantos 
grupos de eoehes eomo eoehes existen en la poblaeión que se estudia. 
Inieialmente, eada grupo está eonstituido eomo un eoehe. El método une 
los dos grupos más próximos según alguna medida de proximidad o 
distaneia (euelidea, ete.) obteniendo asi n-1 grupos. Se repite el proeeso 
uniendo los dos más próximos y asi sueesivamente. El árbol de 
elasifieaeión obtenido se llama dendrograma. Si se buseara una partieión 
en tres elases se eortaria el árbol donde tenga tres ramas, se eonservaria 
los grupos determinados por la parte inferior del árbol y se deseribiria 
esta partieión. 

- Los métodos no jerárquieos busean partieionar una poblaeión de n 
objetos en k grupos eon un eriterio de optimizaeión global. El método 
más empleado es el de agregaeión alrededor de eentros móviles. En él el 
usuario elige el número de elases a obtener y una partieión inieial, que 
puede ser al azar. El algoritmo repite las dos fases siguientes, de forma 
sueesiva. En primer lugar ealeula el eentro de gravedad de eada elase. 
En la segunda se reasigna eada elemento al grupo euyo eentro está más 
próximo. El proeeso eontinúa hasta obtener elases estables. Es deeir, 
euando las iteraeiones siguientes no produeen modifieaeión en las 
elases. 


10.7.2. Métodos de clasificación ascendente 


10.7.2.1. Metodología 



Estos métodos proceden a la construcción de clases uniendo sueesivamente 
las dos elases u objetos más semejantes. 

Las téenieas se difereneian entre si en que, 

- La medida de la distaneia entre los objetos, eomo ya se ha meneionado. 

- El eáleulo de la distaneia entre grupos. 

Se puede definir la distaneia entre estos eomo la distaneia entre sus eentros, 
o bien entre los dos elementos más próximos, uno de eada grupo (eriterio del 
salto mínimo) o bien entre los más alejados, o el método de momento de orden 
dos, llamado método de Ward, ete. 

El algoritmo sigue las siguientes fases, 

- Cada uno de los objetos a elasifiear forma un grupo. 

- Se busea los dos elemento más próximos y se agregan pasando a formar 
un solo grupo. 

- Se ealeulan las distaneias entre los grupos resultantes. 

- Se busean los dos grupos más próximos y se agregan. 

- Se repite en proeedimiento ealeulando las nuevas distaneias. 

10.7.2.2. Un ejemplo 

Consideremos un ejemplo seneillo eon euatro mareas de eoehes, en los que 
se han medido dos earaeteristieas: prestaeiones y equipamiento, en una eseala 
de 1 a 5. 



Prestigio 

Equipamiento 

A 

1 

4 

B 

5 

4 

C 

1 

3 














D 


2 


1 


En la primera etapa se consideran cuatro grupos cada uno formado por un 
coche, y se calculan las distancia entre ellos 

La jerarquización obtenida se muestra en el siguiente árbol. 
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Las ramas más largas indican mayor distancia entre los grupos. El gráfico 
recoge las distancias (al cuadrado) correspondientes a cada etapa de 
agregación. Si se partiera el árbol con una recta vertical se obtienen las 
particiones. Asi una partición en dos clases obtiene la formadas por 6 y 2, es 
decir, por las marcas (A, C, D} y {B}. 

Si se particiona en tres grupos se obtienen 5, 4 y 2. Es decir, (A, C} , {D} y 
{B}. 

El grupo (A, C} se caracteriza porque la media en prestaciones es 1 y en 
equipamiento es 3,5. El grupo D tiene medias de 2 y 1 respectivamente y B de 
5 y 4. 

No existe un procedimiento único para determinar el número de grupos. En 
ocasiones el investigador lo hace siguiendo criterios pragmáticos. Otras veces 
se mantienen grupos que sean interpretables. Otro criterio puede ser que el 
grado de homogeneidad de cada grupo alcance un valor determinado. 

Sobre un árbol suele ser conveniente hacer los cortes donde las ramas sean 
largas. 


10.7.3. La clasifícación y el análisis factorial 

Los métodos de clasificación clásicos se adaptan muy bien cuando las 
poblaciones están descritas por variables métricas. Los métodos más 
habituales trabajan con centros de gravedad, minimizan varianzas, etc. Estas 
técnicas no se pueden aplicar a datos cualitativos o variables nominales. 






Cuando se trata de encuestas en las que se utilizan variables nominales, 
antes de realizar la clasificación, se convierten los datos en cuantitativos 
realizando un análisis factorial. 

En el análisis factorial cada objeto u observación queda descrito por sus 
coordenadas factoriales. Si se mantienen todos los factores se conserva el 
100% de la información. Las nuevas variables o factores son siempre 
cuantitativas y pueden ser analizadas con los procedimientos clásicos de 
clasificación. Por ejemplo, en el apartado 10.6.2 se ha descrito un conjunto de 
jóvenes por unas variables nominales de comportamiento ante el ocio. Para 
obtener grupos de jóvenes con comportamiento semejante no se pueden aplicar 
los métodos expuestos para variables métricas. En lugar de analizar el cuadro 
10.16 se puede analizar mediante clasificación la tabla de coordenadas 
factoriales de los individuos obtenida como resultado del análisis de 
correspondencias múltiples del cuadro 10.16, las coordenadas recogidas en el 
cuadro 10.18. 

Si se consideraran todos los factores se mantendría la misma información 
pero en este caso es métrica y válida para realizar los cálculos de clasificación 
con centros de gravedad. 

El procedimiento tiene, además, otras ventajas. Si no se conservaran todos 
los ejes sino sólo los primeros, desechando los últimos por no ser 
significativos, se abandonarla información que recogerla fluctuaciones 
aleatorias que podrían enmascarar fenómenos importantes. Asi la clasificación 
sobre los resultados factoriales puede proporcionar resultados más estables. 


10.7.4. Un caso práctico. Grupos de jóvenes y el ocio 

A partir de los ejes factoriales se obtendrá una clasificación de los jóvenes 
encuestados del apartado 10.6.2. El objetivo del estudio es buscar grupos de 
jóvenes que tienen un comportamiento semejante en sus ratos de ocio. Para 
ello se parte de los resultados del análisis de correspondencias múltiples del 
cuadro 10.16, buscado grupos de filas o personas. Las variables género y 
estudios también actúan como ilustrativas en este caso. Son variables de 
caracterización, no de comportamiento. Por lo tanto únicamente servirán para 
describir los grupos obtenidos con él. 


El programa de tratamiento de datos empleado, SPADN, obtiene 
clasificaeión jerárquica de los individuos caracterizados por sus coordenadas 
factoriales utilizado el criterio de agregación de Ward. Este método es el más 
adecuado cuando las variables son los factores, como en este caso. 

Los resultados son los siguientes. El dendrograma de la clasificación 
aparece en el gráfico 10.7. 


Gráfico 10.7 
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Tras observar el dendrograma se ha decidido obtener una partición en tres 
clases. El cuadro 10.20 describe los grupos: el 1 y 3 están compuestos cada 
uno por cuatro personas, y son muy homogéneos, pues sus inercias son de 
0,1233 y 0,1827 respectivamente. El grupo 2 está compuesto por 10 personas y 
es más heterogéneo; su inercia e 0,8081. 
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La composición de las clases es la siguiente (se muestran los números que 
identifican a las personas). 


Clases 

Contiene las personas 

Clase 1/3 

Clase 2/3 

Clase 3/3 

01 02 09 10 

03 04 07 08 11 12 13 16 17 18 

05 06 14 15 


El cuadro 10.21 contiene la descripción de los grupos por sus modalidades 
tanto de comportamiento como de caracterización. A partir de ella se 
describen los grupos. 

Klimage 
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El cuadro 10.21 se lee de siguiente forma. El 80% de las personas que han 
elegido la modalidad diseoteea mueho están en la elase 1; y el 100% de las 
personas de esta elase han elegido la modalidad diseoteea mueho. Las dos 
primeras eolumnas proporeionan el valor test del eontraste t Student y el grado 
de signifieaeión. Para interpretar el grupo se eligen aquellas modalidades más 
signifieativas; grado inferior a 0,05 o valor test superior a 1,96. 

Descripción de los grupos 

• Grupo 1. Los sociables. Esta formado por cuatro personas y es muy 
homogéneo. Su inercia es 0,1233. Todos los jóvenes de este grupo han 
elegido las modalidades discoteca y bares mucho y lectura nada. Se 
caracterizan porque todos ellos tienen estudios elementales y 
predominan las mujeres (un 75%). 

• Grupo 2. Son los «adocenados». Está formado por diez jóvenes y es el 
más heterogéneo. Contiene a todos los que han elegido las modalidades 
discoteca poco, lectura poco, música nada, y el 85,71% de bares poco. 
No todos los del grupo realizan las actividades en ese grado (poco o 
nada). El 80% de la clase ha elegido discoteca poco. En este grupo se 
encuentran todas las personas de estudios medios, aunque sólo sean el 
60% del grupo. La mitad del mismo no escucha música, y el resto poco. 

• Grupos 3. Son los individualistas o intelectuales, compuesto por cuatro 
personas. Todas han elegido las modalidades lectura mucho (le-m), 
discoteca nada (di-n) y un 75% bares nada (ba-n). La mitad de la clase 
hace poco deporte. Toda la clase tiene estudios superiores. 


10.7.5. Aplicaciones del análisis de clasifícación 

• Se utiliza con frecuencia para obtener segmentos de mercado. Se pueden 
obtener grupos homogéneos basándose en variables de actitudes, de 
comportamientos, de ventajas buscadas en el producto, etc. Estos grupos 
se pueden describir por las características sociodemográficas y detectar 
asi segmentos de mercado o necesidades especificas e identificarlos con 
variables conocidas como la edad, status, etc. 


Por ejemplo, si se obtuviera la elasifieaeión de un grupo de personas a 
través de sus respuestas a unas preguntas sobre las earaeteristieas que valoran 
a la hora de eomprar un automóvil, se pueden deteetar grupos según ventajas 
buseadas y earaeterizar eada grupo por las variables de edad, género, renta, 
status soeioeeonómieo, ete. Esto permite eonoeer el grupo objetivo y 
planifiear una eampaña publieitaria; medios, soportes, ete. 

• Igualmente se pueden busear grupos de personas que eonsuman un 
produeto porque eneuentren en él las mismas ventajas. Ello darla pie a 
una segmentaeión del mereado por ventajas o benefieios buseados. 

El análisis de elasifieaeión se utiliza en estudios muy diversos. Por ejemplo 
elasifiear, 

• A la poblaeión a sus aetitudes antes las promoeiones de ventas, 
earaeterizando eada grupo eon atributos demográfieos o 
soeiodemográfieos. 

• Ciudades por sus earaeteristieas y obtener eiudades tipo que pueden 
servir eomo mereados test. 

• Países o mereados semejantes en funeión de sus earaeteristieas en 
general en los que las posibilidades de penetraeión de produetos sean 
inieialmente pareeidas. 

• Empresas eompetidoras o grupos estratégieos, mareas eompetidoras 
(sustitutivas). 

• Segmentos de eonsumidores de aeuerdo eon sus earaeteristieas objetivas 
y subjetivas. 


10.8. ANÁLISIS 

MULTIDIMENSIONAL NO 
MÉTRICO 


10.8.1. Introducción 



El análisis multidimensional no métrico (AMN) es un conjunto de métodos 
que permiten posicionar objetos como marcas, productos o empresas sobre un 
gráfico, tal como hacen los métodos factoriales. Sin embargo, si bien los 
métodos factoriales sólo tratan variables métricas o nominales, el AMN parte 
de datos de orden. Puede tratarse de una ordenación de semejanzas entre los 
objetos o bien sobre las preferencias. 

El AMN, a partir de datos de orden, posiciona los objetos sobre un espacio 
de pequeña dimensión. Estos métodos tienen su aplicación natural en los 
estudios de imagen, posicionamiento o preferencias de marcas en el mercado. 

Cuando uno de estos estudios se efectúa con métodos factoriales es 
necesario identificar previamente los atributos o caracteristicas, muchas veces 
tras desarrollar fases cualitativas, que pueden diferenciar los objetos en 

r 

opinión de los encuestados. Estos deben evaluar o asociar las caracteristicas 
con los distintos objetos, lo que supone un esfuerzo considerable para el 
encuestado en el caso de que las caracteristicas sean numerosas. Por otra parte, 
la omisión de alguna de ellas que sea importante no quedará reflejada en el 
análisis y éste no será completo. Incluso puede resultar inútil. En todo caso la 
consideración de distintas variables puede modificar el mapa de 
posicionamiento. 

En el AMN no es necesario elegir las caracteristicas. El entrevistado ordena 
o evalúa los objetos de forma global, sin que se vea influenciado al 
mencionarle distintas caracteristicas. En esta valoración u ordenación global el 
encuestado considera todos los aspectos sin detallarlos, incluso valora algunas 
caracteristicas de forma inconsciente, como, por ejemplo, preferir una marca 
porque es la que tiene su vecino. 

El AMN detecta a posterior! cuáles son las dimensiones o caracteristicas en 
las que se basa el encuestado para percibir o evaluar los objetos y en definitiva 
aquellos en función de los cuales elige. Dentro del AMN se distinguen dos 
clases de análisis: el análisis de proximidades y el análisis de preferencias. 


10.8.2. El análisis de proximidades 


1 o, 8.2,1, Características 



El análisis de proximidades o similitudes parte de un conjunto de n objetos 
como marcas, productos, empresas, etc., sobre el que se dispone de 
información acerca de las similitudes o sobre las disimilitudes entre ellas. El 
análisis sitúa estos objetos sobre un espacio de dimensión reducida, de manera 
que los más semejantes estén más próximos, es decir, que el orden generado 
entre las distancias entre los n puntos u objetos sea lo más próximo posible al 
orden entre las disimilitudes. Por ejemplo, se puede disponer de la siguiente 
información sobre cuatro marcas de coches A, B, C, D: 

Esta tabla indica que A y B son las más semejantes (menos disimilares) y 
Ay D las menos semejantes. Su análisis de proximidades proporciona el 
gráfico 10.8 
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Gráfico 10.8. Posícíonamíento de las marcas 
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Ha convertido la jerarquía de disimilitudes en distancias sobre un plano de 
manera que las más similares A y B son las más próximas. Las más 
disimilares (las menos parecidas) A y D son las más distanciadas (téngase en 
cuenta que las escalas horizontal y vertical no coinciden). Existen diversos 
algoritmos para lograr este mapa. Parten de una configuración inicial que 
puede ser aleatoria o partir de otro análisis, y se va mejorando la configuración 
moviendo los puntos en pequeños desplazamientos hasta que en una iteración 
se consigue una convergencia o un indice de adecuación suficiente entre las 
distancias y las disimilaridades. 

La observación del gráfico permite conocer qué marcas son competidoras, si 
existe un hueco de mercado, qué características son percibidas por los 
consumidores, etc. 

10.8.2.2. Recogida de la información 

Existen diversos métodos de obtención de información, es decir, de una 
medida de las similaridades o de las disimilaridades. Sólo se expondrán tres de 
los más usuales. 


• Jerarquía del grado de similitud. Si se han de posieionar n objetos, se 
pueden formar n • (n - l)/2 pares. El entrevistado debe ordenar todos los 
pares en orden creeiente de sus diferencias. Para facilitar la tarea se suele 
representar cada pareja en una tarjeta por separado. Se le entregan al 
encuestado todos los cartones o tarjetas y se le pide que seleccione el que 
contenga la pareja más semejante. Se retira ésta y se repite el proceso 
con las restantes. De esta manera se obtiene una clasificación de más a 
menos similares, o, lo que es lo mismo, el orden creciente de las 
disimilar!dades, como en el ejemplo anterior. El problema de este 
método es que si el número de objetos considerado es grande, resulta 
difícil jerarquizar sus semejanzas. Téngase en cuenta que con sólo ocho 
objetos deben clasificarse veintiocho pares, y cuarenta y cinco si fueran 
diez. 

• Método del pivote. En este caso se compara cada objeto con los restantes. 
Para ello se toma uno llamado pivote y se pide al entrevistado que 
indique qué objetos son similares a él. Para facilitar la labor suele 
colocarse cada objeto en una tarjeta. A continuación se repite el proceso 
con otro objeto y asi sucesivamente. De esta forma se obtiene para cada 
encuestado una tabla del siguiente tipo. 

X indica que se han considerado similares el objeto de la fila y el de la 
columna. 

Esta tabla puede no ser simétrica. Este hecho reflejaría dificultades de 
percepción o errores del encuestado. Sin embargo, al trabajar con una muestra 
esta dificultad desaparece, trabajando con datos agregados de todos los 
encuestados. 
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Los datos agregados forman una tabla de similitudes a partir de las 
frecuencias de la siguiente forma. La similitud entre el objeto i y el objeto j, 
S(ij) es: 
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donde: 


n¡j es el número de personas que opinan que el objeto i es semejante 

alj, 

ni. es el número de objetos a los que se parece i, 
n.i es el número de objetos parecidos al objeto i. 

Sobre esta tabla agregada de similitudes se aplica el análisis de 
proximidades. 

Igualmente se pueden definir otros indices de similitud a partir de las 
frecuencias. Por ejemplo, si en el indice anterior se suprime el denominador. 

• Cuando el número de objetos es grande, es difícil obtener una ordenación 
directamente; en este caso se puede pedir al entrevistado que evalúe el 
grado de similitud de cada pareja de objetos. Para ello se le entrega al 
encuestado una tarjeta con una pareja de objetos y se le pide que evalúe, 
por ejemplo, de 1 a 10 o de 1 a 7 la similitud. Una valoración más alta 
indica un mayor grado de similitud. A partir de las evaluaciones 
otorgadas a todas las parejas por una muestra de personas, se construye 
una tabla de valoraciones medias de la similitud. 

Por ejemplo, la siguiente tabla puede analizarse asi, pero suele ser 
aconsejable convertirla en datos de orden, en lugar de utilizar los datos 
métricos. 
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A partir de ésta se obtiene la tabla de disimilitud siguiente. Los que hayan 
obtenido una valoración más alta son los más altos en similitud y los más 
bajos en disimilitud. 
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Cuando se analizan datos agregados de una muestra y no individuales, es 
necesario que el grupo cuya opinión se agrega sea homogéneo, tenga 
percepciones semejantes, pues en caso contrario el resultado reflejará una 
opinión media que no representa a nadie. Antes de agregarlos es necesario 
considerar alguna medida de homogeneidad, como por ejemplo un coeficiente 
de correlación por rangos, si se tratara de datos de orden, que permita obtener 
una tipologia y agregar únicamente los que sean semejantes, obteniendo un 
mapa para cada grupo. 


10.8.2.3. Los ejes 


Los ejes son las dimensiones o earaeteristieas en las que se fijan los 
eneuestados para juzgar las semejanzas o difereneias entre las mareas y en 
definitiva para haeer su eleeeión. 

Ya se ha meneionado que en ningún momento se han espeeifieado las 
earaeteristieas de los objetos. Los eneuestados eomparan de forma global. 
Posteriormente el análisis identifiea las dimensiones que los difereneian, en 
opinión de los eneuestados. El número de ejes es generalmente inferior al 
obtenido en el análisis faetorial y debe ser espeeifieado por el analista. 

Suele eomenzarse solieitando un análisis en dos ejes y obtener una medida 
de la bondad de la representaeión o de la adeeuaeión entre las distaneias y las 
disimilaridades. Esta medida se llama stress. Un stress pequeño indiea una 
buena representaeión. Se eonsidera que un stress de 0,2 o superior es malo; si 
valiera 0,1, es regular, y si fuera inferior a 0,05, es bueno. 

Si eon dos dimensiones el stress fuera malo, se probaria eon tres 
dimensiones, euatro, ete. 

La interpretaeión de los ejes es subjetiva. Esto haee que en oeasiones sea 
difieil. No obstante, se puede ayudar a la interpretaeión eon reeogida de 
informaeión adieional, una vez obtenidos los datos que se analizarán mediante 
el AMN, y no existe ya la posibilidad de influir en la pereepeión del 
eneuestado. Esa reeogida adieional son las valoraeiones de los objetos en 
distintas earaeteristieas y se analiza mediante regresiones o eorrelaeiones 
entre los ejes obtenidos y estas earaeteristieas. 

10.8.2.4. Estudio deposicionamiento de ciudades 

Con objeto de diseñar politieas turistieas, el Gobierno ha realizado un 
estudio de imagen de eiudades eon relaeión a la oferta de atraetivos turistieos. 
La siguiente tabla reeoge informaeión sobre el orden de disimilitudes 
expresado por una pequeña muestra. El proeedimiento de obteneión de 
informaeión ha sido el del pivote, antes expuesto. Los datos de orden apareeen 
en la siguiente tabla de disimilitudes: 
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El orden de disimilitud de Ciudad Real y Madrid es el mismo que el de 
Ciudad Real y Alicante. En consecuencia, en lugar de ocupar los órdenes 6 y 7, 
ambas parejas ocupan el orden 6,5. 

Los resultados obtenidos tras analizarse mediante el programa KYST son 
los siguientes. Las coordenadas de las ciudades sobre los ejes son: 



1 

2 

Madrid 

-1,172 

-0,874 

Salamanca 

-0,777 

-0,339 

Ciudad Real 

0,132 

0,419 

Barcelona 

-0,001 

-0,746 

Villanueva 

0,530 

0,971 

Alicante 

1,288 

0,569 


Gráfico 10.9. Posícíonamíento de las ciudades 
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El stress con dos dimensiones es 0.0035, valor suficiente para una correcta 
representación. El gráfico 10.9 (ver página anterior) debe ser interpretado. 

Tras observar los ejes, se interpretan de la siguiente forma. El eje vertical es 
un eje de cultura. Cuanto más hacia abajo se encuentre la ciudad, se percibe 
como de mayor oferta cultural. El eje horizontal es un eje de naturaleza y se 
interpreta de forma análoga: cuanto más se sitúa a la derecha, más se asocia a 
oferta de naturaleza. Luego, este grupo de personas valora las ciudades con 
relación al ocio según las dimensiones cultura y naturaleza. 

De acuerdo con la información dada por la muestra, en el plano Madrid se 
percibe como una ciudad adecuada para un turismo cultural, mientras que 
Alicante sólo ofrece naturaleza. Barcelona tiene las dos caracteristicas, aunque 
cada una de ellas en menor medida que Madrid y Alicante, respectivamente. 
Por el contrario, Villanueva está muy mal posicionada en cultura. Esta ciudad 








debería cuestionarse un cambio, pues su imagen no se asocia a nada en 
especial. 


10.8.3. Análisis de preferencias 

10.8.3.1. Características 

El análisis de preferencias representa gráficamente las de un grupo de 
personas sobre un conjunto de objetos como marcas, empresas, productos, etc. 
Parte de datos de orden de preferencias sobre los objetos y representa 
gráficamente los objetos y las personas o grupos de personas, de manera que 
una persona que prefiera un objeto a los demás estará más cerca de él sobre el 
gráfico. Es decir, la distancia del individuo a los objetos será mayor cuando 
disminuya su preferencia. 

Esta técnica es de gran utilidad en marketing, pues el consumidor puede 
diferenciar las marcas por algunas características que sin embargo no son 
decisorias para la compra. Por ejemplo, puede diferenciar los coches según 
sean nacionales o importados, pero ésta puede no ser una variable importante 
para su decisión. 
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Este gráfico se ha obtenido a partir de datos de orden, proximidades y 
preferencias sobre las marcas de coches (A, B, C, D, E) de cuatro personas (il, 
i2, i3, i4). Se han interpretado los ejes de forma subjetiva como Lujo y Todo 
terreno (TT). Se observa que hay dos marcas C y F que se perciben semejantes. 
Son de lujo y distanciados del concepto de vehículo TT. La persona i3 prefiere 
la marca C, y en segundo lugar F. La que menos le gusta es A. La persona il 
prefiere la marca Ay en segundo lugar G. 

Existen dos grupos con preferencias bien diferenciadas. Las personas i2, i3, 
que prefieren un coche de lujo, mientras que il e i4 desean un TT sin lujos. 
Las aspiraciones no son homogéneas, sino que se observan dos segmentos de 
mercado, que habrán de ser evaluados cuantitativamente, deberán ser 
accesibles y susceptibles de respuesta a programas de marketing específicos. 
No hay consumidores que deseen un TT de lujo. Las marcas B y D están muy 


mal posicionadas; no satisfacen los gustos de ninguno de los eonsumidores. 
Deberán reposieionarse. 

Existen diversos métodos de análisis de proximidades: 

- Análisis interno. Se basa en que la información sobre las prefereneias 
eontiene ya informaeión sobre las similitudes. Asi, los objetos muy 
alejados en el orden de prefereneias se pereiben eomo muy diferentes. En 
este caso el análisis de preferencias obtiene un mapa de posieionamiento 
de objetos y de personas a partir únieamente de los datos de prefereneias. 

- Análisis externo. Se utiliza eonjuntamente eon el análisis de 
proximidades. Los objetos se sitúan en el plano mediante el análisis de 
proximidades. A eontinuación el análisis externo de preferencias sitúa a 
las personas de manera que cada una esté más próxima a un objeto euanto 
más preferido sea. La situaeión de la persona representa su marea ideal, la 
eombinación de atributos que prefiere. Los puntos que tienen igual 
prefereneia están situados en una eireunfereneia (en dos dimensiones) 
euyo centro es el punto ideal (modelo de punto ideal simple). 

Existen otros proeedimientos de análisis de proximidades, eomo el modelo 
veetorial, que representa a las personas eon vectores. En el modelo de punto 
ideal ponderado los sujetos ponderan de diferente forma los atributos. 

10.8.3.2. Recogida de la información 

Existen diversos procedimientos: 

-El encuestado compara los objetos por pares. Para eada par de objetos A, 
B (marcas de refreseo, por ejemplo), se le pregunta: ¿Prefiere A a B? La 
respuesta debe ser Si o No. La persona eneuestada para eomparar n 
objetos efeetúa n(n-l)/2 eomparaeiones. Asi, al eomparar cuatro objetos, 
A, B, C y D, se obtiene para eada persona una tabla eomo la siguiente: 

En la que 1 indiea que el objeto de la fila es preferido al de la columna y 
cero que no. Este sistema puede obtener tablas ineoherentes. 

t^image 


- El encuestado expresa directamente su orden de preferencias. Para ello se 
suele situar cada objeto en un cartón y se le pide que elija el preferido. A 
continuación, el preferido entre los que quedan, y asi sucesivamente. Este 
procedimiento no genera incoherencias, pero es difícil de aplicar cuando 
son muchos los objetos. 

10.8.3.3. Las aspiraciones de los turistas 


Caso práctico 


En este ejemplo se trata de estudiar la aspiraciones o preferencias de los 
consumidores para elegir su lugar de vacaciones. Se ha considerado (por 
simplicidad) una muestra de tres personas que han expresado sus preferencias 
sobre la ciudades consideradas en el caso anterior de la siguiente forma: 

t^image 

Indica que la primera persona prefiere Madrid; en segundo lugar. 
Salamanca; en cuarto lugar. Ciudad Real, etc. 

El análisis de preferencias proporciona a partir de estos datos y de los 
resultados del análisis de proximidades realizado en el apartado 10.8.2.4 el 
siguiente gráfico 10.10. 

Tras observar el gráfico, se concluye que las tres personas son muy 
diferentes. La persona il exige cultura, por ello su ciudad preferida es Madrid; 
la persona i2 desea sólo naturaleza, en mayor medida que la proporcionada por 
Alicante, que es su ciudad preferida. La persona i3 quiere mucha naturaleza y 
mucha cultura. Ninguna ciudad responde totalmente a sus aspiraciones. 
Barcelona es la que más se aproxima a sus deseos. 

Gráfico 10.10 

t^image 


10.8.4. Aplicaciones del AMN al marketing 



Los métodos de AMN se apliean en diversos easos. Por ejemplo, son útiles 
en los estudios de lanzamiento de nuevos produetos. Estos análisis permiten 
ver el posieionamiento de la eompeteneia y la distaneia de eada produeto a las 
aspiraeiones del eonsumidor, lo que indiea la situaeión relativa de eada 
produeto y lo que puede oeurrir en el futuro. Además permiten deteetar qué 
earaeteristieas son mejoradles para reposieionarse según los deseos del 
eonsumidor. 

El AMN se apliea en estudios de imagen, posieionamiento y espeeialmente 
en segmentaeión por ventajas buseadas, ya que el análisis muestra diferentes 
grupos de prefereneias que eorresponden a grupos de elientes distintos 
respeeto a lo que busean en el produeto o servieio. 
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PREPARACION DE 
INFORMES. UN CASO DE 
POSICIONAMIENTO EN EL 
MERCADO DE VEHÍCULOS 


11.1. OBJETIVOS DEL CAPÍTULO 

El último tema de este libro muestra la estruetura de un informe de 
investigaeión eomereial. Se expliea paso a paso eómo se ido 
desarrollando una investigaeión; desde las motivaeiones hasta las 
reeomendaeiones. El leetor puede ver eómo se expliea el desarrollo de 
una investigación y se comentan los resultados. En lineas generales 
muestra el contenido de un informe. 


11.2. LOS INFORMES DE LAS 
INVESTIGACIONES 
COMERCIALES. ESTRUCTURA 


Quienes desarrollan las investigaciones comerciales deben presentar 
informes sobre el trabajo que han desarrollado. Ea estructura de los 
informes aparece recogida en el cuadro 11.1. A continuación, con la ayuda 
de un caso se muestra cómo se ha ido desarrollando una investigación y se 
proporcionan los elementos constitutivos del informe. 





11.3. PLANTEAMIENTO DE UN 
CASO: MARCAS DE 
AUTOMÓVILES. LA 
IDENTIFICACIÓN DE 
COMPETIDORES 


11.3.1. Objetivos de la investigación 

• Planteamiento del problema. Motorcar es un fabricante coreano de 
automóviles que desea introducirse en el mercado español. Fabrica 
un modelo de coche del segmento medio con distintas versiones de 
acabado y motorizaciones; desde una básica 90 Cv y acabado muy 
sencillo, hasta una versión turbo, GTI de 150 Cv. con el máximo 
acabado, pasando por una intermedia de 115 CV y equipamiento 
medio. Motorcar desconoce la situación del mercado del automóvil 
en España, aunque ya posee algunos puntos de venta, pues 
comercializa camiones y furgonetas. La distribución no le preocupa 
inicialmente, pues ya cuenta con su propia red de ventas. Lo que 
desea Motorcar es conocer el posicionamiento de las marcas coches 
para poder introducir su modelo básico de 90 CV. Por el momento y 
hasta obtener resultados no se plantea introducir sus modelos de 115 
y 150 CV. 

• Necesidades de investigación. Motorcar tiene que analizar el 
mercado y encontrar el segmento en el que ha de competir. Debe 
identificar cuáles son sus marcas competidoras para adoptar las 
estrategias de diseño del producto y su precio, distribución y 
comunicación. Para ello ha encargado una investigación de mercados 
a una reconocido instituto de investigación, llamado INC con los 
siguientes objetivos. 

• Objetivos de la investigación. Para poder tomar la decisión de 
entrada es necesario. 



1. Obtener un mapa de posieionamiento de las mareas en el mereado 
de automóviles. 

2. Identificar fortalezas y debilidades de cada una de ellas. 

3. Proponer estrategias de producto y precio para introducirse en el 
mercado español. 


11.3.2. Metodología de la investigación 

• Fuentes de información. Con objeto de encontrar los atributos que 
pueden ser tenidos en cuenta por los consumidores INC ha procedido 
a realizar una fase cualitativa para identificarlos. Para ello se 
consultaron diversas revistas especializadas del mundo de motor, 
como Autopista, Motor 16, Auto-journal, etc. Las variables 
consideradas fueron las que destacan los pilotos de pruebas cuando 
hacen sus comentarios sobre los coches que ensayan. Además se han 
tenido en cuenta otras, las que los usuarios comentan en sus cartas de 
consultas técnicas o cuando manifiestan sus quejas. 

Las variables tenidas en cuenta en el estudio han sido las siguientes. 

pl AERODINÁMICA 
p2 CLIMATIZACIÓN 
p3 CONFORT 
p4 DURACIÓN 
p5 ESTABILIDAD 
p6 MANTENIMIENTO 
p7 FIABIEIDAD MECÁNICA 
p8 VAEORACIÓN USADO 



p9 GARANTÍA DURACIÓN 

pío ROBUSTEZ 

pll SEGURIDAD 

pl2 EUJO 

pl3 DEPORTIVO 

pl4 CEÁSICO 

pl5 COEORES 

pl6 HABITABIEIDAD 

pl7 DISEÑO 

pl8 TAEEER 

pl9 CONSUMO 

p20 EQUIPAMIENTO-OPCIONES 
p21 CAEIDAD GENERAE 
p22 PRECIO ASEQUIBEE 
p23 INNOVACIÓN 


Técnica de recogida de información. Para recoger la información 
INC ha considerado que la mejor herramienta es la encuesta personal 
a domicilio. Para ello ha diseñado un cuestionario de escalas de 
asociación en el que los encuestados han asociado atributos a 
marcas. El cuestionario ha sido respondido por 10.000 personas 
mayores de 25 años, propietarias de un coche y su selección ha sido 
aleatoria mediante generación de números de teléfono. 



Posteriormente se ha acudido a los domicilios para cumplimentar los 
cuestionarios. La muestra, por su edad y por ser propietaria de un 
coche se supone que puede dar opiniones conocimiento de causa. 

• La ficha técnica del maestreo es la siguiente. 


Población 

18.535.000 propietarios de 
turismos 

Tamaño de la muestra 

10.000 personas 

Selección de la muestra 

Aleatoria, por teléfono 

Técnica de recogida de 
información 

Encuesta a domicilio 

Lugar 

Capitales de provincia 

Criterio de estratificación 

Tamaño del hábitat 

Error 

Inferior al 1 % 

Confianza 

Superior el 95% 

Fecha 

Mayo de 2003 


El cuadro 11.1 recoge las frecuencias de asociación entre marcas y 
coches. Cada columna se corresponde con los atributos en el orden 
expuesto. 


Cuadro 11.1. Frecuencias de asociación entre marcas y 

atributos 


Contenidos 

Aspectos a tener en cuenta 

Presentación del trabajo 

Explicación breve de la investigación 

Contenidos 

Indice temático 

Objetivos de la 
investigación 

Especificación del problema 

• Detección de las necesidades del 
cliente 

• Objetivos de la investigación 

Metodología seguida 

• Fuentes de información 

• Técnicas empleadas 




















Ficha técnica 
Técnicas de muestreo 


Resultados 

• Tablas 

• Gráficos 

• Técnicas estadísticas 

Conclusiones y 
recomendaciones 

• Interpretación de resultados 

• Recomendaciones 

Anexos 

• Cuestionarios 

• Material auxiliar: cintas, vídeos 

• Bibliografía 


Tabla 11.2. Frecuencias de asociación entre marcas y atributos 


BMW 

740 

797 

941 

812 

786 

524 

815 

756 

746 

806 

801 

837 

701 

798 

681 

793 

744 

673 

497 

767 

838 

387 

643 

ALFA 

654 

667 

675 

626 

663 

572 

630 

550 

588 

615 

650 

650 

704 

569 

559 

636 

618 

583 

521 

649 

643 

576 

581 

AUDI 

784 

802 

813 

794 

800 

570 

785 

723 

740 

771 

810 

783 

675 

727 

672 

795 

764 

692 

598 

764 

801 

509 

687 

CITR 

646 

580 

626 

592 

653 

586 

589 

497 

541 

562 

580 

538 

522 

513 

582 

593 

559 

593 

589 

600 

589 

673 

589 

FIAT 

551 

527 

576 

587 

581 

616 

592 

535 

551 

553 

568 

533 

542 

510 

585 

579 

582 

517 

613 

554 

614 

617 

623 

FORD 

548 

557 

618 

691 

617 

625 

656 

560 

606 

628 

611 

543 

517 

552 

609 

601 

589 

582 

607 

557 

637 

685 

548 

HOND 

726 

661 

656 

676 

656 

530 

689 

641 

622 

616 

631 

651 

71* 

456 

529 

606 

685 

493 

533 

618 

673 

490 

690 

LANC 

657 

671 

700 

690 

702 

575 

689 

655 

633 

656 

678 

676 

709 

602 

577 

661 

644 

597 

547 

657 

681 

512 

670 

MERO 

730 

825 

874 

867 

830 

518 

847 

767 

768 

835 

867 

909 

587 

839 

676 

848 

770 

700 

450 

806 

870 

335 

610 

NISS 

643 

654 

665 

694 

666 

595 

686 

633 

669 

717 

695 

639 

578 

540 

542 

658 

654 

610 

590 

635 

671 

545 

646 

OPEL 

604 

538 

594 

637 

609 

630 

604 

596 

559 

579 

617 

566 

572 

519 

596 

590 

602 

560 

623 

536 

596 

631 

560 

PEUG 

629 

630 

673 

689 

686 

625 

676 

637 

622 

644 

618 

597 

543 

623 

598 

643 

624 

643 

608 

634 

667 

616 

617 

POfiS 

903 

825 

762 

821 

820 

526 

803 

793 

773 

752 

829 

865 

92* 

571 

655 

624 

833 

658 

418 

758 

848 

313 

651 

RENA 

611 

629 

640 

700 

650 

677 

686 

587 

610 

620 

626 

575 

555 

622 

655 

645 

601 

685 

663 

625 

658 

688 

641 

ROVE 

686 

705 

755 

728 

703 

666 

713 

629 

635 

732 

727 

754 

582 

709 

617 

718 

668 

571 

544 

698 

751 

527 

647 

SAAB 

768 

769 

783 

780 

766 

564 

779 

694 

723 

767 

791 

784 

712 

636 

614 

750 

691 

622 

505 

757 

800 

421 

660 

SEAT 

434 

467 

491 

574 

529 

609 

548 

409 

496 

486 

512 

409 

391 

496 

559 

530 

474 

545 

579 

504 

500 

701 

444 

SUZU 

660 

641 

638 

675 

660 

549 

678 

613 

607 

634 

645 

641 

701 

504 

525 

604 

698 

497 

543 

613 

677 

470 

678 

TOYO 

770 

695 

682 

711 

704 

558 

756 

754 

756 

722 

797 

814 

741 

505 

569 

631 

731 

591 

511 

695 

727 

447 

681 

VW 

612 

607 

625 

715 

674 

591 

714 

613 

614 

662 

698 

592 

597 

557 

584 

612 

600 

593 

583 

548 

681 

581 

598 

VOLV 

613 

751 

789 

812 

791 

602 

800 

704 

718 

816 

861 

795 

578 

756 

642 

786 

621 

636 

574 

744 

790 

477 

620 


Técnica de análisis de datos. Considerando la naturaleza de la 
investigación y la fuente de datos a analizar se ha aplicado análisis 
factorial de correspondencias, que es la herramienta idónea para 
























































estudiar tablas de contingencia. Para formar los grupos se ha 
empleado análisis cluster. 


11.3.3. Resultados y recomendaciones 


El gráfico 11.1 muestra los valores propios. Dos ejes recogen más del 
86% de la información. La que proporcionan los restantes es despreciable. 
Las tablas 11.2 y 11.3 muestran las coordenadas, contribuciones y cosenos 
cuadrado de atributos y marcas. 


Gráfico 11.1. Valores propios 


Número 

Valor 

propio 

% 

Acumulado 

% 


1 

,0065 

67,94 

67,94 


2 

,0018 

18,74 

86,68 


3 

,0003 

3,33 

90,01 


4 

,0003 

2,81 

92,83 


5 

,0001 

1,45 

94,28 









Cuadro 11.3. Coordenadas, contribuciones y cosenos cuadrado de las variables 



COORDENADAS 

CONTRIBUCIONES 

eos. CUADRADO 

lOENTIFlCADOR 

1 

2 

3 

4 

5 

1 

2 

3 

4 

5 

1 

2 

3 

4 

5 

AERO • Aerodinámica 

.05 

-.07 

,02 

.01 

•.X 

1.4 

10.8 

7.7 

.8 

2 

,26 

.54 

.07 

.01 

,x 

CUM-CSmatúación 

.06 

.00 

.02 

-.00 

-.01 

2.1 

.0 

4.3 

,1 

2.4 

,81 

,x 

.X 

.X 

.X 

CONF - Confort 

.04 

.03 

.02 

-.02 

.01 

1.2 

3.0 

8.3 

4.8 

25 

,38 

57 

.14 

.07 

.X 

DURA - Duración 

.01 

.02 

-.02 

,01 

.01 

.1 

.8 

4.9 

3.8 

35 

.X 

50 

53 

.15 

.07 

ESTA • Estabiíúad 

.02 

.00 

.01 

.01 

-.01 

2 

.0 

1.8 

.6 

25 

.31 

.02 

.13 

,04 

.X 

MANT • Mantenimiento 

-.14 

-.01 

-.01 

-.00 

-.01 

11.8 

.1 

1.1 

2 

1.8 

.93 

.X 

.X 

.X 

.X 

FIAS • Fiabilidad mecánica 

.02 

.01 

-.02 

.01 

.X 

2 

.1 

6.0 

.6 

.6 

.29 

.04 

.35 

.X 

.X 

VALO - Vatorackw usado 

.05 

-.02 

-.03 

.X 

.02 

1.0 

.9 

11.1 

,4 

105 

,56 

.X 

.17 

.X 

.07 

GARA • Garantía dilación 

.03 

-.01 

-.02 

.01 

-.X 

.5 

.1 

6.1 

3.1 

,4 

.42 

.02 

54 

.10 

,01 

ROBU • Robustez 

.03 

.03 

-.02 

-.01 

-.01 

.8 

1,8 

8.1 

.7 

35 

.41 

54 

,20 

.01 

,04 

SEGO-Seguridad 

.05 

.01 

-.03 

.01 

-.02 

1.5 

.6 

9.6 

1.9 

17.6 

.54 

,x 

.17 

.X 

.14 

LUJO-Lujo 

.10 

.00 

-.00 

-.01 

-.02 

6.8 

.0 

.3 

.4 

75 

.92 

.X 

,X 

.X 

.X 

DEPO - Deportivo 

.06 

-.12 

.02 

.01 

.X 

2.0 

32.1 

6.4 

,7 

.0 

,16 

,74 

,X 

.X 

.X 

CLAS-Clásico 

.01 

.11 

.02 

-.01 

.01 

,0 

26.7 

6.6 

1.5 

6.1 

,X 

.X 

,04 

.01 

,X 

COLO - Colones 

-.05 

.02 

.01 

.02 

,02 

1.9 

1.0 

2.0 

9.1 

75 

,X 

.X 

,x 

.12 

,x 

HABI - Habitabiliad 

.00 

.05 

.01 

-.02 

-.01 

.0 

6.6 

.5 

10,0 

1.0 

,x 

.73 

,01 

.17 

.01 

DISE-Diseío 

.03 

-.04 

.00 

.M 

.02 

.6 

4.6 

.0 

.0 

115 

.23 

.47 

.X 

,x 

.X 

TALL-T^ 

-.04 

.03 

.02 

,04 

.X 

1.2 

1.8 

35 

225 

5 

.36 

.14 

,x 

57 

.X 

CONS-Corrsutr» 

-.17 

-.01 

-.02 

-.02 

.01 

16.9 

.4 

3.8 

4.8 

1.9 

,96 

.01 

.01 

.01 

.X 

EOUI • Equipamento opciones 

.03 

.01 

.02 

-.01 

-.02 

,7 

.4 

5.8 

.7 

9.6 

,42 

.07 

.17 

.X 

,13 

CALI ■ Cakdad general 

.04 

.01 

-.00 

.X 

.01 

1.1 

2 

.3 

.0 

2.0 

,76 

,X 

.01 

X 

.X 

PREC-Preoo asequible 

-.29 

-.02 

.01 

.01 

-.01 

46.7 

.6 

1.3 

.6 

55 

.99 

.X 

.X 

.X 

.X 

INNO - Innovación 

-.02 

-.06 

-.01 

-.X 

.01 

.4 

7,4 

.7 

32.8 

2.0 

.X 

.49 

.01 

.X 

.01 




















Cuadro 11.4. Coordenadas, contribuciones y cosenos cuadrados de las marcas 



COORDENADAS 

CONTRIBUCIONES 

eos . CUADRADO 

IDENTIFlCADOfi 

1 

■> 


4 

5 

1 

1 


4 

5 

1 

. 

3 

4 

5 

BMW 

.10 

.05 

.02 

-.110 

.02 

7.6 

6 .N 

5.3 

•t 

.} 

14.9 

.73 

.18 

.02 

.00 

. 0.3 

ALFA 

-.01 

-.02 

.04 

.00 

-.02 

.1 

1.4 

23.1 

.0 

17.1 

.05 

.16 

.48 

.00 

.15 

AUDI 

.04 

.02 

.01 

-,IK) 

,00 

1.4 

1.2 

2,0 


,6 

.61 

.14 

.(M 

,00 

.01 

erre 

-.10 

-.01 

.03 

.00 

,01 

6.1 


16.2 

.0 

5.7 

.80 

.01 

.10 

.00 

.02 

HAT 

-.10 

-.02 

-.00 

-.02 

.01 

6.0 

1,0 

2 

6.5 

4.2 

.86 

.04 

.00 

,04 

.01 

FORD 

-.10 

.01 

-.02 

.02 

.01 

6.6 

5 

37 

4.3 

1.2 

.89 

.02 

.02 

.02 

. Ot ) 

HOND 

.02 

-.08 

-.00 

-.02 

.01 

.4 

14.7 

.1 

8.6 

1.3 

.07 

.80 

.00 

.07 

.01 

1 \NC 

.01 

-.02 

.01 

-.01 

.00 

.1 

l.l 

1,4 

15 

.3 

.O.S 

2?9 

J 07 

,10 

.01 

MERO 

.12 

.08 

.00 

.01 

.01 

11.9 

20.7 

.0 

.8 

Ü 

.66 

J 12 

.00 

.00 

.00 

NISS 

-.02 

-.01 

-.02 

-.01 

-.01 

.2 

.1 

S ,3 

l.h 

15 

.14 

,02 

J 2 

,05 

.(84 

OPEL 

.09 

-.02 

.01 

.01 

.01 

5.0 

1.0 

1.1 

l.l 

17 

.83 

.05 

.01 

.01 

.01 

PEUG 

-.Oh 

.02 

,00 

.00 

.01 

12 

.6 

*> 

.0 

^2 

.76 

.06 

.00 

. ÍY » 

.((5 

PORS 

.14 

-.07 

.01 

.04 

.00 

m 

lis 

1.8 

. 34.9 

,8 

.75 

.17 

.00 

,07 

.00 

RENA 

-.10 

.01 

.01 

.01 

.01 

7.1 


.6 

l.l 


.91 

.02 

.00 

.01 

.01 

ROVE 

.01 

.03 

.01 

-.02 

-.01 

.1 

3.0 

.5 

10.9 

14 

.0.3 

J 7 

.01 

JO 

.02 

SAAB 

.07 

.00 

.00 

-.00 

-.01 

4JI 

.0 

.1 


5.7 

.92 

.00 

.00 

.00 

.05 

SEAT 

•IS 

.w 

.00 

.03 

-.01 

19.1 

IS 


10.3 

16 

.93 

.04 

.00 

.02 

.00 

SlZl 

.02 

-.06 

-.01 

-.03 

.01 

_2 

8.4 

.9 

II.O 

15 

.07 

.68 

.01 

. 1.3 

.02 

TOYO 

.07 

-.06 

-.03 

.01 

-.02 

3.5 

8.4 

14.1 

1.3 

9.2 

.48 

,32 

.10 

.01 

. 0.3 
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Primer eje. En el primer factor las contribuciones más altas las tienen 
la economía de mantenimiento, el consumo reducido y el precio asequible 
de adquisición. Se trata de un eje de economía. Los consumidores perciben 
este aspecto a la hora de diferenciar las marcas. Las marcas que más 
contribuyen a la formación de este eje son Seat -con la mayor 
contribución de todas- Citroen, Fiat y Opel. Las marcas opuestas a 
economía son las percibidas como lujosas; BMW, Mercedes, Saab y sobre 
todo Porsche. 

Segundo eje. El segundo factor opone la deportividad al clasicismo. Las 
variables aerodinámica y deportividad se oponen a clásico. Las marcas que 
destacan por su carácter deportivo son Porsche, Honda, Suzuki y Toyota 
frente a Mercedes y Volvo, que destacan por ser clásicas. 

Plano (1,2). El gráfico 11.3 muestra el plano (1,2). Sobre él se pueden 
estudiar las posiciones relativas de los coches y la de éstos respecto a sus 




















atributos. En él se aprecia cómo las marcas que podrían llamarse 
nacionales; Seat, Renault, Citroen, Fiat, etc. se sitúan cerca de las 
proyecciones de las variables destacadas para medir la economía sobre el 
eje 1. Mercedes, Porsche Saab y BMW se sitúan con coordenadas 
negativas, lejos de economía, asociadas a lujo. 

En el segundo eje, el vertical, obsérvese cómo Honda y Porsche y se 
proyectan en la parte negativa muy próximas, al lujo. En la parte positiva 
se proyectan Mercedes y Volvo, las marcas más clásicas. 

Gráfico 11.2. Representación de las marcas y de las características 

sobre los ejes i y 2 
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Formación de grupos de marcas. A partir de los ejes factoriales se ha 
procedido a un análisis de clasificación automática. El dendrograma 
aparece en el gráfico 11.2. En él se aprecia que las marcas analizadas se 


















pueden agrupar en tres elases, que minimizan la inercia intraclases y 
maximizan la inercia interclases. Es la mejor partición que puede hacerse. 


1. Clase 1, formada por BMW, AUDI, MERCEDES, PORSCHE, 
ROVER, SAAB, y VOEVO. 


2. Clase 2, formada por AEFA ROMEO, HONDA, EANCIA, NISSAN, 
SUZUKI, TOYOTA, VOESKWAGEN. 

3. Clase 3, formada por CITROEN, FIAT, FORD, OPEE, PEUGEOT, 
RENAUET y SEAT. 

Gráfico 11.3. Dendrograma de marcas de automóviles 



El cuadro 11.4 recoge las características que más y menos definen a las 
clases encontradas. Eos atributos que tienen en mayor medida que la 
media tienen la columna V.Test con signo positivo. Si las tuvieran en 
menor medida que la media tendrían signo positivo. Para esta exposición 






















sólo se han considerado las que superen un contraste con una probabilidad 
5%. No se exponen más de cinco atributos, en uno u otro sentido, por dos 
razones: una es un problema de espacio y la otra es de sentido común; una 
clase se define por unos pocos atributos. Cinco son más que suficientes. 


Cuadro 11.5. Descripción de los atributos de las clases formadas 


NUM. ATRIBUTO 

IDENT. 

PORCENTAJES 
CLA/FRE FRE/CLA GLOBAL 

PESOS 

V.TEST 

PROB. 

CLASE 1 / 3 

aala 



37,02 

115474 



12 LUJO 

LUJO 

40,47 

4,96 

4,54 

14151 

8,66 

,0000 

14 CLÁSICO 

CLAS 

39,96 

4,36 

4,04 

12604 

6,94 

,0000 

3 CONFORT 

CONF 

39,22 

4,95 

4,67 

14576 

5,62 

,0000 

2 CLIMATIZACIÓN 

CLIM 

39,11 

4,74 

4,49 

13998 

5,21 

,0000 

11 SEGURIDAD 

SEGU 

38,91 

4,92 

4,68 

14612 

4,84 

.0000 

CLASE 2/ 3 

aa2a 



32,65 

101847 



13 DEPORTIVO 

DEPO 

36,07 

4,66 

4,21 

13144 

8,47 

.0000 

23 INNOVACIÓN 

INNO 

34,73 

4,46 

4,19 

13084 

5,16 

,0000 

1 AERODINÁMICA 

AERO 

33,80 

4,64 

4,48 

13969 

2,97 

.0015 

17 DISEÑO 

DISE 

33,67 

4,55 

4,41 

13752 

2,60 

.0047 

8 VALORACIÓN 

VALO 

33,41 

4,38 

4,28 

13346 

1,91 

,0280 

CLASE 3/ 3 

aa3a 



30,34 

94643 



22 PRECIO ASEQU. 

PREC 

41,17 

4,87 

3,59 

11201 

24,72 

,0000 

19 CONSUMO 

CONS 

36,61 

4,52 

3,75 

11696 

14,78 

.0000 

6 MANTENIMIENTO 

MANT 

35,49 

4,62 

3,95 

12308 

12,50 

.0000 

15 COLORES 

COLO 

33,14 

4,42 

4,05 

12626 

6,92 

,0000 

18 TALLER 

TALL 

32,63 

4,36 

4,05 

12641 

5,68 

,0000 


Las clases formadas se caracterizan principalmente por. 


• Clase 1: destacan por ser coches lujosos, clásicos, caros, bien 
equipados y seguros. Son coches del norte de Europa; alemanes, 
suecos e ingleses. 

• Clase 2: son los coches más deportivos, innovadores y atractivos. No 
son los más confortables, ni los más habitables, ni los más cómodos. 













ni los más clásicos. Son coches deportivos italianos o japoneses, 
esencialmente. Podrían asociarse por sus caraeteristicas técnicas a 
los que en lenguaje del motor se denomina GTi o 16V. 

• Clase 3: son las marcas más frecuentes en España. Se perciben eomo 
las marcas más económicas, en adquisición y mantenimiento. Lo 
que menos las caracteriza es su carácter deportivo y el lujo. 

Las marcas de cada grupo poseen atributos comunes, que las hacen 
sustitutivas dentro de cada uno de ellos. El análisis ALC eompletado eon 
el de clasifieación ha permitido identificar marcas competidoras. 

En este estudio se analizado la imagen global de las marcas. Podria 
completarse con otros análisis parciales. Por ejemplo seria interesante 
medir la imagen en función del género, si los conductores emplean 
prineipalmente su coehe en ciudad o carretera, si son o no profesionales 
del volante, su antigüedad como conductores, las marcas de coche que han 
tenido antes, etc. El estudio se podria hacer mueho más complejo en lo que 
respeeta a la ealidad de su información. Técnicamente no se plantean 
difieultades espeeiales, pues bastarla utilizar en las tablas de datos de 
frecuencias evaluadas para cada grupo como filas suplementarias. 

Dadas las earaeterísticas de Motorear y del modelo que desea introducir 
en nuestro mercado, las marcas competidoras son el grupo 3, aquellas que 
denominamos económieas en este estudio. 

Algunas recomendaciones que se pueden dar son las siguientes: 

• Motorear debe introdueir su modelo de 90 CV con un precio igual o 
inferior a la media de coches de características similares. Motorear 
debe tener en euenta que lo earaeteristico de sus eompetidores es el 
preeio asequible, el consumo y coste de mantenimiento contenido, 
coste de taller ajustado y gama de colores amplia. 

• Motorear no debe tratar de posicionarse con atributos que comparte 
con sus competidores. No conseguirla un posicionamiento distintivo. 



Sería muy acertado lanzar el coche con un extra que la competencia 
no ofrezca, como aire acondicionado, airbag o ABS que mejorara la 

relación calidad/precio. 

Algunas estrategias de posicionamiento recomendables, siempre 
que sean asequibles para empresa y no penalicen el precio final, 
pueden ser; una garantía de mayor duración que sus competidores; 
instalar buenos amortiguadores para destacar por estabilidad; cuidar 
el equipamiento y el aspecto y calidad de acabado de la marca. Es 
decir, Motorcar debería dotar a su marca de atributos relevantes y 
asequibles para los consumidores; distintivos y no gravosos para la 
empresa. 
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Análisis de Encuestas 

Elena Abascal Fernández 
Ildefonso Grande Esteban 

Para realizar este análisis se ha empleado el paquete SPAD, muy superior 
a otros paquetes estadisticos de análisis multivariantes, ya que puede 
tratar variables categóricas describiendo, a quienes responden las 
encuestas según sus caracteristicas personales. 



Aplicaciones de investigación comercial 

Elena Abascal Fernández 
Ildefonso Grande Esteban 







Este manual es el complemento práctico de Fundamentos y técnicas de 
investigación comercial. Mediante la aplicación de técnicas multivariantes 
a casos concretos, se abarcan todas las fases de la investigación comercial. 
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Investigación comercial 

Gemma García Ferrer 

Este libro pretende ser una guia útil para aquellos alumnos que cursan 
asignaturas de Investigación Comercial. 

Su estructura es sencilla, buscando ante todo, una finalidad didáctica. 



Investigación comercial 

22 casos pácticos 
y un apéndice teórico 
M“ Angeles González Lobo 

Eos casos que se exponen en este libro, constituyen una selección muy 
rica, un buen surtido de ejemplos de todo tipo. Eo atractivo de los casos es 






que no son piezas de investigación aisladas, sino partes de un proceso. 



F undamentos/técnicas de investigación comercial ii* edición es un ma¬ 
nual dirigido a todas aquellas personas, estudiantes, profesionales de la 
docencia o de la gestión de la empresa, deseosas de iniciarse o profundizar 
en el área de la Investigación Comercial desde la perspectiva de una ciencia 
auxiliar del marketing estratégico. 

Este manual ha sido desarrollado en un lenguaje llano, que huye de 
tecnicismos innecesarios, ilustrado con numerosos ejemplos reales. No se 
exponen los fundamentos matemáticos de los métodos estadísticos de aná¬ 
lisis de la información; se enseóan las aplicaciones y sus interpretaciones, 
de forma que el lector puede adquirir soltura en su utilización sin tener que 
dominar los fundamentos matemáticos. 

El libro contempla tres grandes áreas. La primera es metodológica. En 
ella se tratan las necesidades de información de las empresas, la concep¬ 
ción moderna de la Investigación Comercial y sus aspectos éticos, así como 
su implantación en la empresa. 

La segunda parte exporw las técnicas de obtención de información, cua¬ 
litativas y cuantitativas: técnicas primarias y secundarías, como las bases 
de datos, los paneles de consumidores, de detallistas y de audiencias; 
métodos cualitativos como dinámicas de grupo, entrevistas, técnicas de 
creatividad, observación y pseudocompra; metodología de la encuesta y 
del cuestionario: métodos experimentales así como la construcción y vali¬ 
dación de escalas de medición continuas, ordinales y nominales. También 
se contemplan los métodos y técnicas de selección de muestras. 

La tercera parte expone las técnicas de tratamiento de la Información, 
univarlantes y multhrariantes, de dependencia e interdependencia. Esta pu¬ 
blicación se complementa con un CD muy interactivo que incluye la presen¬ 
tación de los once capítulos del libro, en Powerpoint, que sintetiza este 
manual, de gran utilidad tanto para el docente para exponer sus clases 
como para el estudiante para asimilar sus contenidos. 

La presentación se acompaña de un programa estadístico muy sencillo 
de utilizar, pero potente al mismo tiempo, para aplicar las técnicas cuanti¬ 
tativas de investigación comercial expuestas en el libro. Tanto el paquete 
estadístico como su manual de uso son accesibles desde la presentación. 

También se resuelven en el CD decenas casos, muchos de ellos reales, 
aplicando técnicas estadísticas multlvariantes como análisis de componen¬ 
tes principales, análisis factorial de correspondencias simples y múltiples, 
análisis conjunto, modelos logity técnicas de segmentación. 

El CD incluye una base de datos en formato SPSS® sobre el consumo 
de s-ooo hogares anónimos, ampliamente caracterizados por numerosas 
variables, de decenas de bienes y servicios, para poder hacer prácticas de 
análisis de datos con un paquete tan conocido y utilizado como SPSS®. 
El material didáctico de completa con unas lecturas en formato PDF que se 
incluyen en la correspondiente carpeta en el CD. 
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